대규모 데이터 세트의 정확한 고유 개수를 측정하려면 상당한 메모리가 필요하며 성능에도 영향을 줍니다. GA4는 HyperLogLog++(HLL++) 알고리즘을 사용하여 Active users, Session 등 자주 사용되는 측정항목을 추정하여 집계합니다. 근사값을 추정하는 알고리즘이므로 정확한 수치를 파악하는 것은 한계가 있습니다. 구글 테크팀에서 HLL 로직의 영향을 받아 각 세그먼트의 합계와 토탈 값에서 약 2%정도 차이가 발생 가능하다고 합니다.
참고 : Google 애널리틱스의 고유 개수 근사값 | Google Analytics | Google for Developers