Stanford HAI 연구소 소개
Stanford 대학교의 인간 중심 AI (Human-Centered AI) 연구소(이하 HAI)는 2019년에 설립된 학제간 연구 기관으로 AI 연구, 교육, 정책, 실천을 촉진하는 것을 목표로 하고 있습니다. Stanford HAI는 학계, 산업계, 정부, 시민사회 등 다양한 분야의 사상적 리더들을 한데 모아 AI의 발전과 책임 있는 활용을 함께 설계합니다.
The 2025 AI Index Report 소개
AI 인덱스는 2017년 인공지능 백년연구(One Hundred Year Study of Artificial Intelligence)의 연장선으로 시작되었으며, 정책 입안자, 언론인, 기업 임원, 연구자, 일반 대중에게 정확하고 엄격하게 검증된, 전 세계 출처 기반의 데이터를 제공하는 데 전념해왔습니다.
이번 AI Index Report 2025년 여덟번째로 발간된 AI Index Report로, 지금까지 발표된 것들 중 가장 포괄적인 보고서입니다. 올해 보고서에는 AI 하드웨어 생태계의 변화에 대한 심층 분석, 추론 비용에 대한 새로운 추정치, AI 논문 및 특허 동향에 대한 새로운 분석이 포함되어 있습니다.
또한, 책임 있는 AI(RAI, Responsible AI) 실천에 대한 기업들의 채택 현황에 대한 새로운 데이터와, 과학 및 의학 분야에서 점점 더 확대되는 AI의 역할에 대한 분석 범위도 확대되었습니다.
The 2025 AI Index Report의 주요 내용 (Top Takeaways)
여러 벤치마크에서 AI 성능이 지속적으로 향상되고 있습니다 / AI performance on demanding benchmarks continues to improve
2023년, 연구자들은 고도화된 AI 시스템의 한계를 시험하기 위해 MMMU, GPQA, SWE-bench라는 새로운 벤치마크를 도입했습니다. 이후 불과 1년 만에 성능이 급격히 향상되었으며, 각각의 벤치마크에서 점수는 MMMU 18.8포인트, GPQA 48.9포인트, SWE-bench 67.3포인트 상승했습니다. 벤치마크를 넘어서, AI 시스템은 고품질 비디오 생성에서도 큰 진전을 이루었으며, 일부 환경에서는 제한된 시간 내 프로그래밍 작업에서 언어 모델 에이전트가 인간보다 더 뛰어난 성과를 보이기도 했습니다.
In 2023, researchers introduced new benchmarks—MMMU, GPQA, and SWE-bench—to test the limits of advanced AI systems. Just a year later, performance sharply increased: scores rose by 18.8, 48.9, and 67.3 percentage points on MMMU, GPQA, and SWE-bench, respectively. Beyond benchmarks, AI systems made major strides in generating high-quality video, and in some settings, language model agents even outperformed humans in programming tasks with limited time budgets.
AI가 점점 더 일상생활에 스며들고 있습니다 / AI is increasingly embedded in everyday life
헬스케어부터 교통까지, AI는 빠르게 연구실에서 일상생활로 옮겨가고 있습니다. 2023년, 미국 FDA는 AI가 적용된 의료기기를 223건 승인했으며, 이는 2015년의 6건에 비해 큰 폭으로 증가한 수치입니다. 도로 위에서도 자율주행차는 더 이상 실험 단계에 머물지 않고 있으며, 미국 최대 운행업체 중 하나인 Waymo는 매주 15만 건 이상의 자율주행 차량 서비스를 제공하고, 중국의 Baidu는 저렴한 Apollo Go 로보택시로 다수의 도시에서 운영 중입니다.
From healthcare to transportation, AI is rapidly moving from the lab to daily life. In 2023, the FDA approved 223 AI-enabled medical devices, up from just six in 2015. On the roads, self-driving cars are no longer experimental: Waymo, one of the largest U.S. operators, provides over 150,000 autonomous rides each week, while Baidu’s affordable Apollo Go robotaxi fleet now serves numerous cities across China.
회사들은 AI에 전념하고 있으며, 연구 결과 AI가 생산성에 강력한 영향을 준다는 것이 확인되며 사상 최대의 투자 및 사용률을 기록 중입니다 / Business is all in on AI, fueling record investment and usage, as research continues to show strong productivity impacts
2024년 미국의 민간 AI 투자는 1,091억 달러로 증가했으며, 이는 중국의 93억 달러, 영국의 45억 달러에 비해 각각 약 12배, 24배에 해당합니다. 생성형 AI(Generative AI)는 특히 강한 성장세를 보이며, 전 세계적으로 339억 달러의 민간 투자를 유치했고, 이는 2023년 대비 18.7% 증가한 수치입니다. AI의 비즈니스 활용도 또한 가속화되어, 2024년에는 전체 조직의 78%가 AI를 사용한다고 보고했으며, 이는 전년도의 55%에서 크게 상승한 수치입니다. 이와 동시에 점점 더 많은 연구들이 AI가 생산성을 높이고, 대부분의 경우 노동 시장 전반에서 기술 격차를 줄이는 데 도움이 된다는 사실을 확인하고 있습니다.
In 2024, U.S. private AI investment grew to $109.1 billion—nearly 12 times China’s $9.3 billion and 24 times the U.K.’s $4.5 billion. Generative AI saw particularly strong momentum, attracting $33.9 billion globally in private investment—an 18.7% increase from 2023. AI business usage is also accelerating: 78% of organizations reported using AI in 2024, up from 55% the year before. Meanwhile, a growing body of research confirms that AI boosts productivity and, in most cases, helps narrow skill gaps across the workforce.
미국은 여전히 최고 수준의 AI 모델들을 많이 개발하고 있으나, 중국이 성능 격차를 좁히고 있습니다 / The U.S. still leads in producing top AI models—but China is closing the performance gap
2024년, 미국 기관들은 총 40개의 주목할 만한 AI 모델을 발표하며 중국의 15개, 유럽의 3개를 크게 앞질렀습니다. 미국은 모델 수량에서 여전히 우위를 점하고 있지만, 중국 모델들은 품질 격차를 빠르게 좁혀왔습니다. MMLU, HumanEval과 같은 주요 벤치마크에서 2023년 두 자릿수였던 성능 차이가 2024년에는 거의 동등한 수준으로 축소되었습니다. 한편, 중국은 여전히 AI 논문 및 특허 수에서 선두를 유지하고 있습니다. 동시에, AI 모델 개발은 점점 더 글로벌화되어 중동, 라틴아메리카, 동남아시아 등 다양한 지역에서도 주목할 만한 모델이 등장하고 있습니다.
In 2024, U.S.-based institutions produced 40 notable AI models, significantly outpacing China’s 15 and Europe’s three. While the U.S. maintains its lead in quantity, Chinese models have rapidly closed the quality gap: performance differences on major benchmarks such as MMLU and HumanEval shrank from double digits in 2023 to near parity in 2024. Meanwhile, China continues to lead in AI publications and patents. At the same time, model development is increasingly global, with notable launches from regions such as the Middle East, Latin America, and Southeast Asia.
책임있는 AI 생태계는 진화 중이지만, 속도는 균일하지 않습니다 / The responsible AI ecosystem evolves—unevenly
AI 관련 사고는 급격히 증가하고 있으나, 주요 산업 모델 개발자들 사이에서는 표준화된 책임 있는 AI(RAI, Responsible AI) 평가가 여전히 드뭅니다. 하지만 HELM Safety, AIR-Bench, FACTS와 같은 새로운 벤치마크들은 사실성(factuality)과 안전성(safety)을 평가할 수 있는 유망한 도구를 제공하고 있습니다. 기업들 사이에서는 책임 있는 AI의 리스크를 인지하는 것과 실제로 의미 있는 조치를 취하는 것 사이에 여전히 간극이 존재합니다. 반면, 정부는 더욱 긴급한 대응을 보이고 있으며, 2024년에는 OECD, EU, 유엔, 아프리카연합 등 주요 국제기구들이 투명성, 신뢰성, 그리고 기타 핵심적인 책임 있는 AI 원칙에 초점을 맞춘 프레임워크를 발표하면서 AI 거버넌스에 대한 국제 협력이 강화되었습니다.
AI-related incidents are rising sharply, yet standardized RAI evaluations remain rare among major industrial model developers. However, new benchmarks like HELM Safety, AIR-Bench, and FACTS offer promising tools for assessing factuality and safety. Among companies, a gap persists between recognizing RAI risks and taking meaningful action. In contrast, governments are showing increased urgency: In 2024, global cooperation on AI governance intensified, with organizations including the OECD, EU, U.N., and African Union releasing frameworks focused on transparency, trustworthiness, and other core responsible AI principles.
세계적으로 AI 낙관론이 확산 중이지만 지역간의 격차는 여전히 존재합니다 / Global AI optimism is rising—but deep regional divides remain
중국(83%), 인도네시아(80%), 태국(77%)과 같은 국가에서는 대다수가 AI 제품과 서비스를 유익하다고 인식하고 있습니다. 반면 캐나다(40%), 미국(39%), 네덜란드(36%)에서는 낙관론이 훨씬 낮은 수준에 머물고 있습니다. 그럼에도 불구하고 인식은 변화하고 있으며, 2022년 이후 독일(+10%), 프랑스(+10%), 캐나다(+8%), 영국(+8%), 미국(+4%) 등 기존에 회의적이었던 여러 국가에서 낙관론이 크게 증가했습니다.
AI는 점점 더 효율적이고, 저렴하며, 접근가능해지고 있습니다 / AI becomes more efficient, affordable and accessible
점점 더 강력해지는 소형 모델 덕분에, GPT-3.5 수준의 성능을 내는 시스템의 추론 비용은 2022년 11월부터 2024년 10월 사이에 280배 이상 감소했습니다. 하드웨어 측면에서 보면, 비용은 연간 30%씩 감소했고, 에너지 효율은 매년 40%씩 향상되었습니다. 오픈 가중치 모델(open-weight model)도 폐쇄형 모델(closed model)과의 격차를 빠르게 좁혀, 일부 벤치마크에서 성능 차이를 1년 만에 8%에서 1.7%로 줄였습니다. 이러한 추세는 첨단 AI에 대한 진입 장벽을 빠르게 낮추고 있습니다.
Driven by increasingly capable small models, the inference cost for a system performing at the level of GPT-3.5 dropped over 280-fold between November 2022 and October 2024. At the hardware level, costs have declined by 30% annually, while energy efficiency has improved by 40% each year. Open-weight models are also closing the gap with closed models, reducing the performance difference from 8% to just 1.7% on some benchmarks in a single year. Together, these trends are rapidly lowering the barriers to advanced AI.
각국 정부는 본격적으로 AI에 대해 규제와 투자 중입니다 / Governments are stepping up on AI—with regulation and investment
2024년 미국 연방기관들은 총 59건의 AI 관련 규제를 도입했으며, 이는 2023년의 두 배 이상이며 규제를 시행한 기관 수 역시 두 배에 달합니다. 전 세계적으로는 75개국에서 AI에 대한 법률 언급이 2023년 이후 21.3% 증가했으며, 이는 2016년 이후로 9배 늘어난 수치입니다. 이러한 관심 증대와 함께 각국 정부는 대규모 투자를 단행하고 있으며, 캐나다는 24억 달러, 중국은 475억 달러 규모의 반도체 펀드, 프랑스는 1,090억 유로, 인도는 12억 5천만 달러를 약속했고, 사우디아라비아는 1,000억 달러 규모의 ‘Project Transcendence’를 추진 중입니다.
In 2024, U.S. federal agencies introduced 59 AI-related regulations—more than double the number in 2023—and issued by twice as many agencies. Globally, legislative mentions of AI rose 21.3% across 75 countries since 2023, marking a ninefold increase since 2016. Alongside growing attention, governments are investing at scale: Canada pledged $2.4 billion, China launched a $47.5 billion semiconductor fund, France committed €109 billion, India pledged $1.25 billion, and Saudi Arabia’s Project Transcendence represents a $100 billion initiative.
AI 및 컴퓨터 과학 교육이 확산 중이지만 접근성과 준비 수준에는 격차가 있습니다 / AI and computer science education is expanding—but gaps in access and readiness persist
전 세계 국가의 3분의 2는 현재 또는 향후 K–12 컴퓨터 과학(CS) 교육을 제공하고 있으며, 이는 2019년에 비해 두 배 증가한 수치로 아프리카와 라틴아메리카 지역이 가장 큰 진전을 보였습니다. 미국에서는 지난 10년간 컴퓨터 관련 학사 졸업자 수가 22% 증가했습니다. 하지만 많은 아프리카 국가에서는 전기 같은 기본 인프라 부족으로 인해 여전히 접근성이 제한적입니다. 미국에서는 K–12 컴퓨터 과학 교사의 81%가 AI가 기본 CS 교육에 포함되어야 한다고 응답했지만, 실제로 이를 가르칠 준비가 되어 있다고 느끼는 교사는 절반도 되지 않습니다.
Two-thirds of countries now offer or plan to offer K–12 CS education—twice as many as in 2019—with Africa and Latin America making the most progress. In the U.S., the number of graduates with bachelor’s degrees in computing has increased 22% over the last 10 years. Yet access remains limited in many African countries due to basic infrastructure gaps like electricity. In the U.S., 81% of K–12 CS teachers say AI should be part of foundational CS education, but less than half feel equipped to teach it.
산업계는 AI에서 앞서나가고 있지만 첨단 영역은 좁아지고 있습니다 / Industry is racing ahead in AI—but the frontier is tightening
2024년의 주목할 만한 AI 모델 중 거의 90%는 산업계에서 나왔으며, 이는 2023년의 60%에서 크게 증가한 수치입니다. 한편, 인용도가 높은 연구의 주요 출처는 여전히 학계입니다. 모델 규모는 계속해서 빠르게 성장 중이며, 학습에 사용되는 연산량은 5개월마다 두 배, 데이터셋은 8개월마다 두 배, 전력 사용량은 매년 증가하고 있습니다. 그러나 성능 격차는 줄어들고 있으며, 상위 1위와 10위 모델 간 점수 차이는 1년 만에 11.9%에서 5.4%로 줄었고, 1위와 2위 간 차이는 단 0.7%에 불과합니다. 최첨단 영역은 점점 더 경쟁이 치열해지고, 혼잡해지고 있습니다.
Nearly 90% of notable AI models in 2024 came from industry, up from 60% in 2023, while academia remains the top source of highly cited research. Model scale continues to grow rapidly—training compute doubles every five months, datasets every eight, and power use annually. Yet performance gaps are shrinking: the score difference between the top and 10th-ranked models fell from 11.9% to 5.4% in a year, and the top two are now separated by just 0.7%. The frontier is increasingly competitive—and increasingly crowded.
AI는 과학계에서 영향력을 인정받아 최고 권위의 상을 수상하고 있습니다 / AI earns top honors for its impact on science
AI의 중요성이 커짐에 따라 주요 과학 상에서도 이를 인정하고 있으며, 노벨상 2건이 각각 딥러닝으로 이어진 연구(물리학)와 단백질 접힘(protein folding)에 대한 응용 연구(화학)에 수여되었습니다. 또한 튜링상(Turing Award)은 강화학습(reinforcement learning) 분야의 획기적인 공헌에 대해 수여되었습니다.
AI’s growing importance is reflected in major scientific awards: two Nobel Prizes recognized work that led to deep learning (physics), and to its application to protein folding (chemistry), while the Turing Award honored groundbreaking contributions to reinforcement learning.
복잡한 추론은 여전히 도전적인 과제입니다 / Complex reasoning remains a challenge
AI 모델은 국제수학올림피아드 문제와 같은 작업에서는 뛰어난 성과를 보이지만, PlanBench와 같은 복잡한 추론 벤치마크에서는 여전히 어려움을 겪고 있습니다. 모델은 정답이 명확히 존재하는 논리 문제에서도 신뢰할 수 있는 해답을 제공하지 못하는 경우가 많아, 정밀도가 중요한 고위험 환경에서는 활용에 한계가 있습니다.
AI models excel at tasks like International Mathematical Olympiad problems but still struggle with complex reasoning benchmarks like PlanBench. They often fail to reliably solve logic tasks even when provably correct solutions exist, limiting their effectiveness in high-stakes settings where precision is critical.
Stanford HAI의 The 2025 AI Index Report 홈페이지
Stanford HAI의 The 2025 AI Index Report 전체 문서
이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다.
파이토치 한국 사용자 모임
이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일
로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)
아래
쪽에 좋아요
를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~