GC Count

챠트 설명

Y축
- Garbage Collection 횟수를 의미합니다.
- Garbage Collection 이란 바로 "Stop-The-World"입니다.
- Stop-The-World 란, GC를 실행하기 위해 JVM이 어플리케이션 실행을 멈추는 것입니다.
- Stop-The-World 가 발생하면, GC를 실행하는 쓰레드를 제외한 나머지 쓰레드는 모두 작업을 멈추게 됩니다.
- GC 작업을 완료한 이후에야, 이후에야 중단했던 작업을 다시 시작합니다.
- 어떠한 종류의 GC 알고리즘을 사용하더라도 Stop-The-World는 발생합니다.
- 따라서, Garbage Collection 횟수는 자바 어플리케이션의 운영상 성능 요건에 부합합니다.
X축
- 이벤트 발생 시간을 의미합니다.

GC Time

챠트 설명

Y축
- Garbage Collection 실행 시간을 의미합니다.
- Java는 프로그램 코드에서 메모리를 명시적으로 지정하여 해제하지 않는다.
- Java에서는 개발자가 프로그램 코드로 메모리를 명시적으로 해제하지 않기 때문에
- 가비지 컬렉터(Garbage Collector)가 더 이상 필요 없는(쓰레기) 객체를 찾아 지우는 작업을 한다.
- 따라서, Garbage Collection 실행 시간은 자바 어플리케이션이 멈추고 운용되지 않는 시간을 의미한다.
X축
- 이벤트 발생 시간을 의미합니다.

Perm Used

챠트 설명

Y축
- Java Memory를 HotSpot VM이라 칭합니다.
- HotSpot VM은 크게 2개로 물리적 공간을 나누었고, 이것이 Young 영역과 Old 영역이다.
- 아래 그림의 Permanent Generation 영역(이하 Perm 영역)은 Method Area라고도 한다.
- 객체나 억류(intern)된 문자열 정보를 저장하는 곳이며, Old 영역에서 살아남은 객체가 영원히 남아 있는 곳은 절대 아니다.
- 따라서 Perm 의 데이터는 Static, Class, Meta Data의 증가와 연계되어 있다.
X축
- 이벤트 발생 시간을 의미합니다.

TPS

챠트 설명

Y축
- TPS란 Transaction Per Second의 약자입니다.
- TPS는 그 시스템이 자신이 할 수 있는 한도내에서 초당 몇개를 해 낼 수 있느냐를 검사하는 것이다.
- TPS는 검사 시 Active User와 연관되어 있다.
X축
- 이벤트 발생 시간을 의미합니다.

Heap Total

챠트 설명

Y축
- Total Heap Size = S0C + S1C + EC + OC 이다.
- Total Heap size 계산은 JVM 내부 메모리 관리를 위해서 Code Cache라는 이름으로 50Mb 정도의 공간을 추가로 사용한다.
- 즉, 전체 heap 크기는 아래와 같이 계산된다.
X축
- 이벤트 발생 시간을 의미합니다.

Heap Used

챠트 설명

Y축
- Used Heap Size = S0U + S1U + EU + OU 이다.
- 즉 Used Heap의 의미는 현재 Java 객체가 차지하는 메모리 양입니다
- Working Set은 Heap에 살아있는 객체들의 총량을 나타낸다.
- JVM의 관점에서 Used Memory는 Working Set과 Garabage이고 Free Memory는 (현재 Heap 크기 - Used Memory) 이다.
- 만약, -Xms < -Xmx 이고 Used Memory와 현재 힙 크키가 같으면, JVM은 full gc를 한 후에 힙을 키운다.
- 그러나 -Xms와 -Xmx가 같다면 힙은 더이상 커지지 않는다.
X축
- 이벤트 발생 시간을 의미합니다.

Service Monitor

챠트 설명

Y축
- 각개의 Service 개수를 표시합니다.
- Service는 수집된 데이터의 Hash값에 의존하지 않습니다.
- Service는 수집된 데이터의 Service Name의 고유값에 따라 변동됩니다.
- 따라서, Service Monitor Count는 클러스터 기반의 서비스 인스턴스 개수를 확인하는 용도이며,
- HA 구성의 서비스를 모니터링 하거나, 단일 Standalone 서비스라면 Heartbeat 용도의 모니터링 데이터이다.
X축
- 이벤트 발생 시간을 의미합니다.

TopBeat

챠트 설명

Y축
- topbeat는 이름으로 알 수 있듯이,
- 현재 서버의 동작중인 프로세스당 cpu, memory, disk 와 같은 리소스의 점유율 데이터 매트릭스 입니다.
- aRMS는 데이터 수집 상태를 표시하기때문에
- 하기는 HeartBeat를 통해 확인할 수 있는 데이터를 yml에서 추출하여 표기합니다.
X축
- 이벤트 발생 시간을 의미합니다.

MetricBeat

챠트 설명

Y축
- MetricBeat는 TopBeat와 달리 status를 확장한 서버의 CPU, 메모리 부하율 수집이 가능하고,
- 그 외에 네트워크와 io 및 프로세스 로드율을 분석 할 수 있습니다.
- aRMS는 MetricBeat의 데이터 수집 상태만을 표시하기때문에
- 하기는 MetricBeat를 통해 확인할 수 있는 데이터를 yml에서 추출하여 표기하였습니다.
X축
- 이벤트 발생 시간을 의미합니다.

FileBeat

챠트 설명

Y축
- Filebeat는 로그 데이터를 전달하고 중앙화하기 위한 경량의 Producer입니다.
- Host의 var 폴더 밑 Log를 지정하여 데이터를 수집하거나
- 특정 Daemon의 Service Log 데이터를 수집할 수도 있겠습니다.
- 하기는 FileBeat를 통해 확인할 수 있는 데이터를 yml에서 추출하여 표기하였습니다.
- FileBeat는 특별한 설정을 할게 없으나, 파일의 위치를 지정한만큼
- 파일 내용이 모두 수집되기 때문에 주의를 기울일 필요가 있겠습니다.
X축
- 이벤트 발생 시간을 의미합니다.

HeartBeat

챠트 설명

Y축
- Heartbeat는 네트워크 내부 또는 외부에서 사용할 수 있습니다.
- 원하는 HTTP, TCP 또는 ICMP 엔드포인트에 대한 네트워크 액세스만 있으면 되며,
- 모니터링할 URL 목록을 Heartbeat에 의해 데이터가 수집됩니다.
- Heartbeat는 정기적으로 확인 작업을 수행하여
- 엔드포인트가 가동 중인지 또는 중단되었는지 확인 할 수 있습니다.
- 하기는 HeartBeat를 통해 확인할 수 있는 데이터를 yml에서 추출하여 표기하였습니다.
- 파일 내용이 모두 수집되기 때문에 주의를 기울일 필요가 있겠습니다.
X축
- 이벤트 발생 시간을 의미합니다.

PacketBeat

챠트 설명

Y축
- PacketBeat는 HTTP 같은 네트워크 프로토콜로부터
- 애플리케이션 지연 시간 및 오류, 응답 시간, SLA 성능, 사용자 액세스 패턴 및 추이를 수집합니다.
- 이러한 데이터에 접근하여 네트워크 트래픽의 흐름이 어떤지 파악할 수 있습니다.
- 하기는 PacketBeat를 통해 확인할 수 있는 데이터를 yml에서 추출하여 표기하였습니다.
- 패킷 수집 방식을 기본 pcap에서 af_packet 으로 변경이 가능합니다.
- 이 변경은 리눅스 환경에서만 가능하고, CPU Usage를 좀 줄일 수 있다고 하지만
- 트래픽이 많은 서비스의 경우는 크게 효과를 보지는 못하는것 같습니다.
X축
- 이벤트 발생 시간을 의미합니다.

Elastic APM

챠트 설명

Y축
- (Elastic APM) 애플리케이션 성능 모니터링은 메트릭과 로그 사이의 간격을 이어줍니다.
- 로그와 메트릭이 인프라와 구성 요소를 처리하면서 보다 교차적인 경향이 있는 반면,
- APM은 애플리케이션에 중점을 둠으로써 애플리케이션 레이어를 모니터링할 수 있게 해줍니다.
- 모니터링에 APM을 추가하면, ( aRMS는 2가지의 APM을 사용 할 수 있습니다 )
X축
- 이벤트 발생 시간을 의미합니다.