Guess.js: WebApp에서 데이터 기반으로 다음에 방문할 페이지를 예측하는 라이브러리

9bow · 1월 22, 2026, 9:30오후

Guess.js 소개

Guess.js는 데이터 분석과 머신러닝(ML)을 활용하여 웹 애플리케이션의 사용자 경험(UX)을 향상시키는 라이브러리 및 도구 모음입니다. 주로 예측 프리페칭(Predictive Prefetching) 을 구현하는 데 사용되며, 사용자가 다음에 방문할 가능성이 높은 페이지의 리소스를 미리 로드하여 페이지 전환 속도를 획기적으로 개선합니다.

기존의 웹 성능 최적화가 개발자의 직관이나 정적인 규칙에 의존했다면, Guess.js는 실제 사용자들의 방문 데이터(Google Analytics 등)를 기반으로 작동합니다. 사용자가 현재 보고 있는 페이지에서 다음으로 이동할 확률이 높은 경로를 예측하고, 해당 경로에 필요한 자바스크립트 번들만을 선별적으로 미리 가져옵니다. 이를 통해 불필요한 데이터 소모를 줄이면서도 사용자가 체감하는 로딩 속도를 거의 '0'에 가깝게 만들 수 있습니다.

Guess.js 프로젝트는 단일 페이지 애플리케이션(SPA) 뿐만 아니라 정적 사이트 생성기(SSG) 등 다양한 모던 웹 환경을 지원하며, Angular, React(Next.js), Vue(Nuxt.js), Gatsby와 같은 프레임워크 생태계와 통합되어 작동합니다. 데이터 기반의 의사결정을 자동화하여 개발자가 수동으로 프리페칭 대상을 지정하는 번거로움을 해결해 줍니다.

Guess.js vs. 기존 방식 비교

기존의 일반적인 미리 불러오기(프리페칭, Prefetching) 방식과 Guess.js가 제안하는 예측 기반의 미리 불러오기(예측 프리페칭, Predictive Prefetching) 방식은 효율성 측면에서 큰 차이가 있습니다:

기능	기존 프리페칭 (Standard Prefetching)	Guess.js (Predictive Prefetching)
작동 방식	페이지 내의 모든 링크나 개발자가 지정한 특정 링크를 무조건 미리 로드합니다.	사용자 데이터를 분석하여 방문 확률이 높은 링크만 선별적으로 로드합니다.
데이터 효율	사용자가 방문하지 않을 페이지의 리소스까지 로드하여 데이터 낭비(Over-fetching)가 발생할 수 있습니다.	방문 가능성이 낮은 페이지는 제외하므로 대역폭 낭비를 최소화합니다.
네트워크 고려	네트워크 상태와 무관하게 동작하는 경우가 많습니다.	사용자의 네트워크 속도(2G, 4G 등)에 따라 프리페칭 할 번들의 개수를 동적으로 조절합니다.
유지 보수	사이트 구조가 바뀌면 개발자가 프리페칭 설정을 수동으로 업데이트해야 할 수 있습니다.	분석 도구에서 새로운 데이터가 수집되면 예측 모델이 자동으로 갱신되어 최신 트렌드를 반영합니다.

Guess.js의 주요 기능

Guess.js는 빌드 타임과 런타임의 유기적인 결합을 통해 스마트한 프리페칭을 수행합니다. 전체적인 워크플로우는 다음과 같습니다.

데이터 수집 및 모델링 (Build Time)

Guess.js는 빌드 과정에서 Google Analytics(GA)와 같은 분석 도구로부터 사용자의 탐색 경로 데이터를 가져옵니다.

데이터 추출: guess-ga 모듈 등을 통해 "어떤 페이지에서 어떤 페이지로 이동했는지"에 대한 통계 데이터를 수집합니다.
모델 생성: 수집된 데이터를 바탕으로 간단한 머신러닝 모델을 생성합니다. 예를 들어, Home 페이지 방문자의 80%가 Pricing 페이지로 이동하고, 20%가 About 페이지로 이동한다면, 이 확률 정보가 모델에 저장됩니다.

경로와 번들 매핑 (Build Time)

분석 데이터는 URL 경로(Route) 기준이지만, 실제 프리페칭해야 하는 것은 자바스크립트 번들 파일입니다:

정적 분석: guess-parser 모듈이 애플리케이션의 소스 코드를 분석하여 라우트와 자바스크립트 청크(Chunk) 간의 매핑 정보를 생성합니다.
Webpack 통합: guess-webpack 플러그인이 이 과정을 자동화하여, 별도의 복잡한 설정 없이도 빌드 파이프라인에 통합될 수 있도록 돕습니다.

런타임 예측 및 프리페칭 (Runtime)

사용자가 웹사이트를 이용하는 동안 브라우저에서 실시간으로 예측하고, 이를 반영합니다:

확률 기반 실행: 사용자가 특정 페이지에 진입하면, Guess.js 런타임 스크립트는 모델을 조회하여 다음 이동 후보군을 파악합니다.
스마트 로딩: 방문 확률이 설정된 임계값(예: 0.2) 이상인 페이지의 자바스크립트 번들만 <link rel="prefetch"> 태그를 통해 미리 가져옵니다.
네트워크 어댑티브: 사용자의 네트워크 연결 상태(Effective Connection Type)를 감지하여, 속도가 느린 환경에서는 프리페칭을 보수적으로 수행하고, 빠른 환경에서는 더 공격적으로 수행합니다.

주요 지원 프레임워크

Guess.js는 다양한 생태계를 지원하기 위해 여러 패키지를 제공합니다.

Angular: Angular CLI 및 Webpack 빌드 프로세스와 긴밀하게 통합됩니다.
React / Next.js: Next.js의 정적 내보내기나 SSR 환경에서도 활용 가능합니다.
Gatsby: Gatsby 플러그인을 통해 빌드 시점에 페이지 간 연관성을 분석하고 링크 프리페칭을 최적화합니다.
Nuxt.js: Vue.js 기반의 Nuxt 애플리케이션을 위한 모듈을 제공합니다.

Guess.js 도입 시 고려사항 및 리스크 (Risks)

프리페칭 기술을 도입할 때 가장 먼저 고려해야 할 점은 데이터 소모(Data consumption) 문제입니다. 미리 콘텐츠를 내려받는 메커니즘은 제한된 데이터 요금제를 사용하는 사용자에게 의도치 않은 데이터 비용을 발생시킬 수 있어 신중한 접근이 필요합니다. 따라서 솔루션을 구현할 때는 사용자의 Save-Data 헤더 요청을 존중하여 프리페칭 동작을 제한하는 등 네트워크 환경을 배려하는 설계가 수반되어야 합니다.

또한, 원치 않는 페이지의 프리페칭(Prefetching undesirable pages) 으로 인한 부작용을 방지해야 합니다. 예를 들어 '로그아웃' 링크나 페이지 로드와 동시에 '원클릭 구매' 같은 액션이 트리거되는 페이지가 자동으로 미리 로드되어서는 안 됩니다. 이를 해결하기 위해 프리페칭을 절대 수행하지 않을 URL 목록(블랙리스트)을 설정하여, 실제로 사용자에게 도움이 되고 안전한 페이지만을 선별적으로 로드하도록 제어해야 합니다.

마지막으로 웹 표준(Web Standards) 의 변화 흐름을 파악해야 합니다. 과거에는 <link rel=prerender>가 사용되었으나, 최근 Chrome 팀은 이를 더 가볍고 효율적인 NoStatePrefetch 메커니즘으로 대체하려는 움직임을 보이고 있습니다. NoStatePrefetch는 웹 플랫폼의 상태(State)를 실행하지 않고 HTTP 캐시에만 저장하는 방식으로, 단일 리소스만 가져오는 <link rel=prefetch> API와 달리 새로운 렌더러에서 프리로드 스캐너를 실행하여 서브 리소스까지 발견하고 프리페칭한다는 차이점이 있습니다. 개발자는 이러한 표준의 변화와 기술적 차이(API 대 메커니즘)를 이해하고 적절한 방식을 선택해야 합니다.

Guess.js 관련 연구 및 학술적 배경 (Research Review)

페이지 예측 정확도를 향상시키기 위한 기존 연구들은 주로 마르코프 모델(Markov model), 연관 규칙(Association rules), 그리고 클러스터링 기법에 집중되어 있습니다. 다음은 사용자 탐색 패턴을 발견하고 예측 모델을 고도화하기 위해 시도되었던 주요 학술적 연구들의 상세 목록입니다.

Link prediction and path analysis using Markov chains (Sarukkai, 2000): 이 연구는 사용자가 다음에 접근할 페이지를 예측하기 위해 1차 마르코프 모델(First-order Markov models)을 사용하여 웹 페이지 요청 시퀀스를 모델링했습니다. 각 사용자별로 훈련된 '개인화된 마르코프 모델'을 제안했으나, 사용자 기반이 큰 사이트에서는 모든 사용자에 대해 고유 모델을 생성하는 비용이 너무 크고 확장이 어렵다는 한계가 지적되었습니다.
Using Hidden Markov Model to Predict the Surfing User’s Intention of Cyber Purchase on the Web (Chun-Jung Lin, 2005): 은닉 마르코프 모델(HMM)을 웹 브라우징 분석에 도입한 최초의 연구 중 하나입니다. 웹 서버 로그를 수집 및 정제하여 사용자가 단순 서핑 중인지, 아니면 실제 '구매 의도'를 가지고 있는지를 실시간으로 예측하는 모델을 구축했습니다.
A Framework for Web Page Rank Prediction (Elli Voudigari, 2010-2011)
- 과거의 랭킹 데이터를 기반으로 페이지의 향후 랭킹 위치를 예측하는 프레임워크를 제안했습니다.
- 예측된 랭킹과 실제 랭킹 간의 유사도를 측정하여 예측 품질을 정량화했으며, 대규모 데이터셋을 활용해 전역(Global) 및 쿼리 기반 Top-K 랭킹에 대한 실험을 수행했습니다.
Using predictive prefetching to improve World Wide Web latency (Mogul, 1996): 사용자가 다음에 접근할 웹 페이지를 예측하기 위해 N-hop 마르코프 모델을 사용할 것을 제안했습니다. 사용자의 현재 액세스 시퀀스를 과거의 히스토리와 패턴 매칭 시켜 프리페칭의 정확도를 높이고 웹 지연 시간을 개선하는 데 초점을 맞췄습니다.
Evaluating Variable-Length Markov Chain Models for Analysis of User Web Navigation Sessions (Borges, Levene, 2007): 웹 내비게이션 세션 분석을 위해 가변 길이 마르코프 체인(VLMC) 모델의 정확도를 높이는 동적 클러스터링 기반 방법을 제안했습니다. 서로 다른 2차 확률을 가진 인링크(in-links)를 분리하기 위해 '상태 복제(State Cloning)' 개념을 도입하여 모델링의 정교함을 더했습니다.
Investigating the Effect of Duration, Page Size and Frequency on Next Page Recommendation with Page Rank Algorithm (Banu Deniz Gunel, 2010): 기존 페이지 랭크 알고리즘에 페이지 크기, 체류 시간(Duration), 방문 빈도, 전환 시간 등의 다양한 속성을 결합했습니다. 체류 시간 기반 랭크(DPR, Duration Based Rank)와 인기 기반 페이지 랭크(PPR, Popularity Based Page Rank) 개념을 정의하고, 이를 활용하여 기존 알고리즘을 개선하고 다음 페이지 예측 모델을 최적화하는 연구를 수행했습니다.

라이선스

Guess.js 프로젝트는 MIT License로 공개 및 배포 되고 있습니다.

Guess.js 공식 홈페이지

Guess.js 관련 문서

Guess.js 프로젝트 GitHub 저장소

이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다.

파이토치 한국 사용자 모임이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)

아래쪽에 좋아요를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~