벌레에서 인간으로: 뇌 에뮬레이션(Brain Emulation)의 확장 가능성에 대한 종합적 분석 및 연구 (feat. MIT)

벌레에서 인간으로: 뇌 에뮬레이션의 확장 가능성 (feat. MIT)

AI의 대안적 경로, 뇌 에뮬레이션

우리가 "인공지능"이라 부르는 시스템들은 체스, 바둑, 수학 올림피아드, 프로그래밍, 단백질 구조 예측 등 수많은 인지 영역에서 인간의 수준에 도달하거나 이를 넘어서고 있습니다. AI에 대한 투자는 연간 1,000 억 달러에 접근하고 있으며, 2030 년까지 AI 학습에 사용 가능한 컴퓨팅 파워는 GPT-4에 사용된 것보다 10,000 배 이상 확장될 것으로 예상됩니다. 하지만 이 놀라운 발전의 이면에는 근본적인 질문이 남아 있습니다. 현재의 AI 시스템은 인간이 생성한 데이터로 학습되었을 뿐, 구조적으로 인간과는 전혀 다른 존재입니다.

만약 상세한 신경 지도와 기록을 활용하여 인간 뇌 전체를 처음부터 끝까지 에뮬레이션할 수 있다면 어떨까요? 마치 항공기가 새의 비행 원리를 참고하되 새를 그대로 복제하지 않은 것처럼, 뇌 에뮬레이션은 인간 지능의 실제 기반인 생물학적 신경 회로를 직접 재현하여 AI에 대한 근본적으로 다른 접근법을 제시합니다.

MIT의 Isaak Freeman이 Ed Boyden 교수의 지도 아래 작성한 석사 논문 "From Worm to Human: Scaling Brain Emulation" 은 약 50 건의 심층 인터뷰와 수백 편의 논문을 종합하여, 뇌 에뮬레이션이 투기적 열망에서 정량화 가능한 공학적 도전으로 전환되고 있음을 보여줍니다. 커넥토믹스(connectomics), 기능적 이미징(functional imaging), 신경 시뮬레이션(neural simulation)이라는 세 가지 핵심 축의 발전을 체계적으로 조망하며, 각 기술의 현재 상태와 확장 가능성을 정량적으로 분석합니다.

특히 이 논문은 추상적인 가능성 논의를 넘어, 시뮬레이션 한 건당 몇 FLOP/s가 필요한지, GPU당 몇 GB의 메모리가 필요한지, 인터커넥트 대역폭은 얼마나 필요한지, 단일 뇌 이미지를 저장하는 데 얼마의 디스크가 필요한지 같은 페르미 추정(Fermi estimate) 으로 환원합니다. 이 차수 추정(order-of-magnitude)들은 예측이 아니라, 어떤 제약이 오늘 진정으로 묶여 있고 어떤 제약이 가까운 미래에 풀릴지를 분명히 하기 위한 도구입니다. 그 결과 뇌 에뮬레이션은 "공상이 아니냐"라는 질문에서 "언제, 어떻게 할 것인가"라는 공학적 질문으로 옮겨가고 있습니다.

왜 뇌 에뮬레이션을 추구하는가?

뇌 에뮬레이션을 추구하는 이유는 단순히 "가능하니까"가 아닙니다. 이 논문은 뇌 에뮬레이션이 가져올 수 있는 다양한 가치를 조망합니다.

신경과학 연구의 가속화: 디지털 뇌 모델을 사용하면 기억, 인지, 감정의 기저 메커니즘에 대한 가설을 습식 실험실(wet-lab) 검증 전에 계산적으로 테스트할 수 있습니다. 현재 생물학 연구를 제한하는 면역 체계, 두개골, 전뇌 접근성 부족, 비재현성 등의 근본적 장벽을 극복할 수 있습니다. 약리학적 개입이나 병변 효과에 대한 가설을 습식 실험 전에 계산적으로 검증할 수 있어, 반복 속도와 재현 가능성을 크게 높일 수 있습니다.

뇌 질환 치료: 뇌 질환과 장애는 전 세계적으로 34 억 명 이상에게 영향을 미치고 있습니다. 상세한 계산 모델은 TMS, tDCS, 초음파, 심부 뇌 자극 등 비침습적 신경 조절 기법의 자극 파라미터를 우울증이나 파킨슨병 같은 질환에 대한 임상 적용 전에 체계적으로 최적화할 수 있습니다.

뇌에서 영감을 받은 AI 아키텍처: 인간의 뇌는 약 20 W의 전력으로 작동하는 반면, 대규모 AI 시스템은 메가와트 수준의 전력을 소비합니다. 생물학적 신경 연산에 대한 상세한 이해, 특히 에너지 효율성, 기존의 가치 및 정렬 시스템, 소수 샘플 학습(few-shot learning) 등은 생물학적 원리와 현재의 머신러닝 접근법을 결합하는 새로운 하이브리드 아키텍처에 영감을 줄 수 있습니다.

정렬된 AI로의 대안적 경로: 현재의 AI 시스템은 인간 데이터로 학습되었지만 구조적으로 인간이 아닙니다. 전뇌 에뮬레이션은 설계상 인간의 가치, 동기, 인지 아키텍처를 상속받기 때문에 정렬 문제에 대해 질적으로 다른 접근법을 제공할 수 있습니다.

의식과 주관적 경험 연구: 다양한 충실도 수준에서 디지털 신경계를 실행하면, 오늘날 대체로 철학적인 영역에 머물고 있는 의식과 인격(personhood)의 문제에 경험적 발판을 마련할 수 있습니다. 디지털 시스템이 의식 상태와 연관된 기능적 시그니처를 재현한다면, 이는 새로운 종류의 실험적 증거가 될 수 있습니다.

장수와 디지털 연속성: 고해상도 뇌 에뮬레이션이 개인의 정체성을 뒷받침하는 인과적 구조를 보존할 수 있다면, 원리적으로는 생물학적 한계를 넘어선 의식의 연속을 가능하게 할 수 있습니다. 분자 수준 개입과는 질적으로 다른 장수 접근법이며, 잠정적으로는 냉동 보존된 조직으로부터의 복구와도 호환될 수 있는 경로입니다.

문명적 회복 탄력성과 로봇 공학: 디지털 마인드는 생물학적 마인드와 달리 백업, 복제, 분산 저장이 가능합니다. 이는 파국적 위험(catastrophic risk)에 대한 일종의 문명적 이중화 장치로 기능할 수 있습니다. 또한 인간의 운동 계획과 감각 운동 통합 능력은 현재의 로봇 제어 시스템을 크게 앞서 있어, 비정형 환경에서 작동하는 로봇에 필요한 복잡한 운동 및 인지 사전 정보를 뇌 에뮬레이션이 제공할 수 있습니다.

구조적 이미징의 확장: 뇌의 배선도를 그리다

뇌를 에뮬레이션하기 위해서는 먼저 뇌의 구조를 알아야 합니다. 뉴런이 어디에 있는지, 어떤 종류이고 어떤 모양인지, 어떤 단백질과 분자가 존재하는지, 어디서 시냅스를 형성하며 그 유형은 무엇인지를 파악해야 합니다. 시냅스의 너비는 200-800 nm, 시냅틱 클레프트(synaptic cleft)의 간격은 약 20-30 nm, 비수초 축삭(unmyelinated axon)의 직경은 50-1,000 nm입니다. 이러한 미세한 구조를 정확히 포착하는 것이 구조적 이미징의 핵심 과제입니다.

부피 자체도 핵심 제약입니다. 예쁜꼬마선충의 뇌는 약 10^{-6} mm^3, 초파리 뇌는 약 0.1 mm^3, 마우스 뇌는 약 420 mm^37.5 \times 10^7 개의 뉴런, 인간의 뇌는 1,400,000 mm^3 에 약 8.6 \times 10^{10} 개의 뉴런을 담고 있습니다. 부피는 변의 길이의 3 제곱으로 늘어나기 때문에, 마우스나 인간 뇌의 이미징은 이미 완료된 예쁜꼬마선충이나 초파리 작업보다 비선형적으로 어려워집니다.

전자현미경 커넥토믹스: 302개에서 139,255개 뉴런으로

커넥토믹스, 즉 뇌의 시냅스 수준까지의 실제 배선도(ground-truth wiring)를 매핑하는 기술은 비선형적으로 발전해 왔습니다. 수십 년 동안 유일하게 완성된 커넥톰(connectome)은 302 개 뉴런을 가진 예쁜꼬마선충(C. elegans)뿐이었습니다. White 등이 1986 년에 전자현미경을 사용하여 7,500 개 이상의 화학적 시냅스, 갭 접합(gap junction), 신경근 접합(neuromuscular junction)을 포함하는 302 개 뉴런을 재구성한 이 작업은 15 년 이상의 고된 수작업이 필요했으며, 뉴런당 평균 11.2 시간 이상이 소요되었습니다. 이후 2012 년에 짝짓기 기능을 담당하는 수컷 특이적 뉴런 약 80 개가 추가로 매핑되었고, 양쪽 성별 모두에 대해 시냅스 강도 가중치를 도입한 종합 매핑(Cook et al., 2019), 다섯 가지 발달 단계의 머리 커넥톰(Witvliet et al., 2021) 등이 이어졌습니다. 예쁜꼬마선충은 약 10 마리의 개체에 대해 커넥톰이 재구성된, 가장 많이 매핑된 유기체입니다.

그 후 초파리(Drosophila) 커넥토믹스가 결실을 맺기 시작했습니다. 2018 년 Zheng 등이 맞춤형 고처리량 연속 절편 투과 전자현미경(ssTEM)으로 완전한 초파리 뇌를 이미징했고, 2020 년 Scheffer 등이 초파리 뇌의 중심부에서 22,594 개 이상의 뉴런과 2,000 만 개 이상의 시냅스를 밀집 재구성하는 기록적 성과를 달성했습니다. 그리고 202410 월, 200 명 이상의 과학자로 구성된 FlyWire 컨소시엄이 성체 초파리 뇌의 완전한 배선도를 발표했습니다. 139,255 개의 뉴런이 5,450 만 개의 시냅스로 연결된 이 커넥톰은 지금까지 매핑된 가장 큰 완전한 뇌입니다.

더 큰 규모로의 확장도 진행 중입니다. NIH가 자금을 지원하는 마우스 뇌 프로젝트는 두 대의 91 빔 전자현미경으로 10 - 15 mm^3 의 마우스 뇌 조직을 스캔하는 것을 목표로 합니다. 완전한 1 mm^3 의 인간 대뇌 피질도 이미 이미징 및 세그멘테이션되어 49,000 개의 뉴런과 1억 5,000 만 개의 시냅스가 포함되었는데, 이는 초파리 뇌 전체의 시냅스 수의 3 배에 달합니다. 또한 마우스 피질의 90 \times 90 \times 60 μm 큐브(0.0005 mm^3)에서 약 40 만 개의 시냅스를 단 4,000 작업 시간 만에 재구성한 사례도 있습니다(Motta et al., 2019).

무엇보다 주목할 만한 것은 뉴런 재구성 비용의 급격한 하락입니다. 1980 년대에 예쁜꼬마선충 뉴런 하나를 재구성하는 데 약 \$16,500 가 들었지만, 2025 년에는 초파리 뉴런이 약 \$214, 제브라피시 뉴런은 약 \$100 으로 떨어졌습니다. 포유류 뉴런은 아직 \$500-\$1,000 수준이지만, 추세는 가속되고 있습니다. 10 억 달러 규모의 마우스 커넥톰 프로젝트를 실현하려면 뉴런당 약 \$10 까지, 동일 예산의 인간 커넥톰은 뉴런당 약 \$0.01 까지 낮춰야 합니다. 현재 비용과는 5 자릿수의 격차가 있지만, 교정(proofreading)이 EM 커넥토믹스 비용의 대부분을 차지하고 있어 AI 기반 자동화로 이 격차를 줄일 수 있는 여지가 큽니다.

고처리량 전자현미경과 인간 뇌 이미징의 규모

마우스 뇌 전체(500 mm^3)를 이미징하는 것만 해도 생물학 분야의 메가스케일 프로젝트입니다. 빠른 산술 추정을 해보면, 10 nm 등방 해상도에서 500 mm^35 \times 10^{17} 복셀(voxel)에 해당합니다. 현재 전자현미경의 이미징 속도를 1.5 \times 10^8 복셀/초로 잡으면, 단일 현미경으로 연속 가동 시 약 104 년이 걸립니다. 5 년이라는 목표에 맞추면 약 20 대의 현미경이 병렬로 필요합니다.

Wellcome Trust 보고서도 마우스 뇌 전체 이미징에 약 20 대의 병렬 현미경과 5 년이 필요하다고 결론지었습니다. 현재 학술 및 정부 시설이 이미 5-10 대의 현미경을 운영하고 있으므로, 이는 대규모 프로젝트 수준에서 충분히 실현 가능합니다.

인간의 뇌(1,400,000 mm^3)는 마우스보다 약 2,800 배 더 크기에 한 차원 다른 접근이 필요합니다. 하지만 현재의 전자현미경은 물리적 또는 공학적 한계에 훨씬 미치지 못합니다. 2015 년 Zeiss가 생산한 61 빔 SEM은 약 1 GHz의 피크 이미징 속도를 달성했으며, 2024 년에는 버스트 속도 1.8 GHz, 유효 이미징 속도 0.3 GHz가 보고되었습니다(Zheng et al., 2024). 이 프로토타입은 250{,}000 \times 250{,}000 nm의 육각형 시야와 5 \times 5 nm 해상도를 가지며, 본래 반도체 산업용으로 제작되어 생물학 응용을 위한 추가 최적화 여지가 남아 있습니다. 최신 331 빔 버전으로 선형 외삽하면 약 5.4 GHz에 달하며, 전문가들은 1,000 빔도 불가능하지 않다고 봅니다. 저자의 추정에 따르면, 10 GHz급 고처리량 양산형 SEM 200 대가 있으면 16 nm 복셀 크기에서 약 10 년 안에 인간 뇌를 이미징할 수 있으며, 현미경 비용만 약 2 억 달러입니다.

주요 EM 제조업체들은 아직 이러한 고처리량 현미경을 생산할 수요에 직면하지 않았습니다. 저자가 지적하듯, 충분히 큰 주문이나 대규모 프로젝트가 제조업체의 장인 방식에서 대량 생산 규모의 경제로의 전환을 촉발하면, 비용은 급격히 떨어질 수 있습니다.

시료 준비: 자르고 염색하고 임베딩하기

이미징 이전에, 뇌 시료는 아주 얇고(ssSEM은 50 nm, FIB-SEM은 5 nm 두께), 무거운 금속으로 염색된 상태여야 합니다. 자연 상태의 뇌는 그 중 어느 것도 아닙니다. 따라서 광범위한 시료 준비 과정이 필요합니다: (1) 글루타르알데하이드와 파라포름알데하이드 같은 알데하이드로의 고정, (2) 대비를 높이기 위한 사산화오스뮴 등의 중금속 염색, (3) 에폭시 수지 임베딩이 그것입니다. 이 단계들 사이에 뇌는 작은 슬라이스로 분할되어야 합니다.

가장 직관적인 접근은 고정 직후 비브라톰(vibratome)으로 뇌를 두꺼운 슬라이스(예: 마우스 뇌의 경우 13 장)로 자르고, 각 슬라이스를 염색하고 수지에 임베딩하는 것입니다. 그러나 비브라톰 절단의 거칠기로 인해 채터(chatter)나 칼자국 같은 아티팩트가 생겨 절단면을 가로지르는 추적이 어려워집니다. 인터뷰한 전문가들은 핫 나이프(hot-knife) 초고예 비브라톰 기술이 두꺼운 슬라이스 사이에서도 추적 가능성을 충분히 개선할 수 있다는 데 낙관적이었습니다. 대안적으로 12 단계 프로토콜과 시간 경과 마이크로 X선 이미징을 결합해 자르기 전에 뇌 전체를 고정, 염색, 임베딩하는 접근도 시연되었으며, 마우스 뇌에 약 6.4 주, 마모셋 뇌에는 외삽으로 약 2 년이 걸립니다(Lu et al., 2023).

자동화는 비용을 가장 빠르게 떨어뜨릴 수 있는 지점입니다. GridTape TEM 은 연속 절편을 TEM 호환 슬롯 그리드 위에 자동으로 배치해 멀티빔 이미징의 처리량을 크게 끌어올렸고, 핫 나이프 기법은 수지에 임베딩된 큰 시료를 다루기 쉬운 슬랩으로 분할합니다. 빔라인 최적화, 자동화된 시료 핸들링, 관련 인프라까지 종합적으로 개선될 경우 유효 데이터 수집 속도가 한 자릿수 자릿수 더 높아질 수 있다고 추정됩니다. 이 비유는 반도체 팹과 닮아 있습니다: 나노미터급 시료 핸들링이 장인 작업에서 로봇 작업으로 옮겨가는 순간, 단가는 가파르게 떨어지고 신뢰성은 더 빠르게 좋아집니다.

뉴런 재구성: 정합, 추적, 교정, 주석

이미지 데이터가 수집된 뒤에는 뉴런 재구성이 시작됩니다. 이는 (1) 데이터 준비, (2) 추적, (3) 교정의 세 단계로 구성되며, 마지막으로 (4) 주석(annotation) 단계가 더해집니다.

정합(registration) 은 데이터 준비 단계의 핵심 병목입니다. 인접한 스캔을 정렬하지 못하면 자동 뉴런 재구성에서 가장 큰 오류 원천이 됩니다. 머신러닝 기반의 아티팩트 제거, 디워핑(de-warping), 노이즈 감소 기법은 진성 정합 오류를 0.06\% 수준까지 줄였습니다(Popovych et al., 2022). 다음 단계인 세포 경계 분할과 뉴런 골격 추적 은 역사적으로 전적으로 수작업이었습니다. 예쁜꼬마선충 커넥톰 추적이 15 년 이상 걸렸고, 초파리 뇌 추적은 뉴런당 평균 11.2 시간이 들었습니다.

이 비용 구조를 가장 크게 흔든 것이 Flood-Filling Network(FFN) 입니다. Google이 제안한 FFN은 이전 방법 대비 자동 분할 정확도를 10 배 이상 끌어올렸으나, 그만큼 높은 컴퓨팅 비용을 동반합니다(Januszewski et al., 2018). 이 컴퓨팅 비용을 줄이는 것이 현재 진행 중인 핵심 공학 과제입니다. 교정(proofreading) 은 여전히 가장 비싼 단계로, FlyWire 초파리 커넥톰만 해도 인간 교정 작업이 33 인-년 이상 투입되었습니다(Dorkenwald et al., 2024). 마우스 뇌처럼 약 1{,}000 배 큰 대상이 되면, 인간 검토자가 가장 불확실한 영역만 표시하도록 안내하는 AI 기반 교정 파이프라인이 사실상 필수입니다.

마지막으로 주석 단계는 시냅스 검출, 세포 유형 주석, 신경전달물질 분류 등 후속 시뮬레이션에 결정적인 메타데이터를 부여합니다.

분자 데이터의 격차도 핵심 한계입니다. 커넥톰은 배선을 포착하지만, 수용체 유형, 이온 채널 밀도, 신경조절물질 농도, 유전자 발현 프로필은 포착하지 못합니다. 공간 전사체학, in-situ 시퀀싱, 다중 단백질 이미징 등이 작은 조직 부피에 대해 이 간극을 메우기 시작했지만, 전뇌 규모로 확장하는 것은 여전히 열린 과제입니다. 이런 분자 정보가 없으면 시뮬레이션은 통계적 사전 분포와 문헌 값에 의존해야 하며, 이는 현재 모델의 큰 불확실성 원천입니다.

광 현미경: 회절 한계 너머의 팽창 현미경

전자현미경이 유일한 경로는 아닙니다. 전자현미경은 물리적으로 0.12 nm까지 해상도를 낼 수 있고, 생명과학용 EM은 일반적으로 측면 3-30 nm, 축 방향 20-50 nm 해상도를 달성합니다. 반면 전통적인 광학 현미경은 회절 한계로 인해 측면 \sim 250 nm, 축 방향 \sim 550 nm 해상도에 묶여 있습니다.

팽창 현미경(Expansion Microscopy, ExM) 은 MIT의 Ed Boyden 연구실에서 2015 년 개발된 혁신적 기술로, 생체분자를 팽창 가능한 하이드로겔에 고정시키고 샘플을 물리적으로 팽창시켜 일반 광학 현미경으로 초해상도 이미징을 가능하게 합니다. 초기에는 4 배 선형 팽창이었지만, 최신 프로토콜은 10 배 이상의 팽창 인자(expansion factor)를 달성하여 커넥토믹스에 필요한 해상도 영역에 접근하고 있습니다.

밀집 표지(dense labeling) 기법도 함께 발전하고 있습니다. 두 가지 주요 접근은 (1) NHS-에스터 염료를 이용한 비특이적 단백질 고정 표지(pan-protein staining)와, (2) 젤에 앵커링되는 인터컬레이팅 프로브를 이용한 지질 막(lipid membrane) 표지입니다. 지질 막 표지를 사용한 초구조 막 팽창 현미경(umExM)은 4 배 팽창에서 이미 수초 축삭(myelinated axon, Rand 점수 0.995 \pm 0.004)과 비수초 축삭(unmyelinated axon, Rand 점수 0.993 \pm 0.006)의 매우 정확한 추적 가능성을 입증했으며, 이때 유효 해상도는 약 60 nm입니다(Shin et al., 2024). 12 배 팽창 인자를 가진 반복적 전략이 개발 중이며, 미세한 가시 목(spine neck) 구조를 신뢰성 있게 감지하려면 20-24 배 팽창이 필요할 수 있습니다. pan-protein 표지와 지질 표지를 결합하면 향후 재구성 정확도가 크게 개선될 것으로 기대됩니다.

ExM의 핵심 장점은 분자 주석(molecular annotation)과의 호환성입니다. 단백질 염색(protein staining)과 결합하면 이온 채널, 수용체, 신경펩타이드 분포 등의 나노미터 해상도 공간 정보를 수집할 수 있어, 커넥톰과 분자 데이터를 결합하는 유망한 경로가 됩니다. ExA-SPIM 같은 기술은 초당 946 메가복셀의 속도로 3 배 팽창된 마우스 뇌 전체를 24 시간 안에 이미징할 수 있음을 보여주었습니다.

단백질 바코딩과 PRISM: 교정 비용의 혁신적 절감

전자현미경에서 뉴런 추적은 고해상도 이미지와 시간 소모적인 재구성 및 교정에 의존합니다. 하지만 만약 같은 뉴런을 세포체(soma)와 먼 축삭 말단 모두에서 고유하게 식별할 수 있다면, 완벽한 추적 가능성이라는 구속 조건이 크게 완화됩니다. 심지어 한 구간이 완전히 손실되더라도 바코드를 통해 올바른 식별이 가능합니다.

Brainbow 와 그 후속 기술인 Tetbow 은 형광 단백질의 조합 발현을 통해 뉴런을 고유한 색상으로 표시합니다. 초기 클레임은 약 100 가지의 구분 가능한 색조였습니다. 그러나 이런 그라디언트 색상 방식은 세포 유형별 발현 불균일성, 축삭 내 단백질 수송의 불균일성, 형광 염색의 불균일성으로 인해 동일 뉴런 내에서도 색상이 달라지는 문제가 있습니다. 이를 해결하기 위해 이진(binary) 시스템, 즉 "단백질이 존재하는가, 아닌가"를 신호로 쓰는 방식이 제안되었습니다.

Bitbow5 개의 이진 XFP에 막, 골지체, 핵 같은 표적 위치 지정(targeted localization)을 결합하여, 단순 계산으로도 2^5 \cdot 2^5 \cdot 2^5 - 1 = 32{,}767 개의 조합을 만들어냅니다(Li et al., 2021). 더 나아가 스파게티 몬스터(spaghetti monster)와 같은 고신호 단백질 구조를 AAV로 전달하면, 25 개의 무작위 발현 단백질로 이론적으로 2^{25} \approx 3{,}300 만 개의 조합이 가능합니다.

다만 2^{25} 는 각 단백질이 독립적으로 확률 0.5 로 발현된다는 최대 엔트로피 가정이며, AAV 감염률과 발현 확률은 보통 50\% 가 아닙니다. 발현 확률 p = 0.3 을 가정하면, 정확히 k = \mathrm{round}(25 \cdot 0.3) = 8 개의 단백질이 발현된 바코드 수는 이항계수 \binom{25}{8} = 1{,}081{,}575 로, 이론치의 약 3\% 수준입니다. 더 일반적으로 Shannon 엔트로피 H(p) = -p\log_2(p) - (1-p)\log_2(1-p) 로 계산한 유효 바코드 공간은 2^{n \cdot H(p)} \approx 2^{22} \approx 4.3 백만 개입니다. 포유류 뉴런의 평균 시냅스 수가 8{,}000-40{,}000 개임을 고려하면, 430 만 개의 고유 바코드는 시냅스 이웃(synaptic neighborhood) 내 뉴런을 고유하게 식별하기에 100 배 이상의 마진을 제공합니다. 핵심 통찰은 바코딩이 뇌 전체의 모든 뉴런을 개별적으로 표지할 필요가 없다는 점입니다. 각 뉴런의 시냅스 이웃 내 뉴런만 고유하게 표지하면 됩니다.

최근의 핵심적인 도약은 PRISM(Photo-connectomic Reconstruction by Iterative Staining with Molecular Annotations) 입니다. PRISM은 세 가지 핵심 기술을 통합합니다: 이진 단백질 세포 바코딩, 팽창 현미경, 자가 교정(self-proofreading) AI 세그멘테이션 모델. PRISM은 기존 단색 방법 대비 8 배 높은 자동 추적 정확도를 달성했으며, 마우스 해마의 약 1{,}000\mu m^3 볼륨에서 시냅스의 분자 매핑도 수행했습니다. 이는 현재 커넥토믹스 비용의 대부분을 차지하는 수동 교정 필요성을 획기적으로 줄여줍니다.

바코딩에는 아직 과제가 있습니다. AAV를 통한 바코드 전달의 분포 균일성, 뉴런 내 먼 축삭과 수상돌기 말단까지의 단백질 이동(trafficking), 다중 라운드 염색과 세척에 따른 조직 열화 등의 문제가 남아 있습니다. 초기 정맥 내 PHP.eB AAV는 마우스 피질 세포의 65-73\% 에 도달하며, 최신 변이체인 AAV.CAP-B10은 개선된 뇌 전체 형질도입(transduction)을 보여줍니다. 다양한 바이러스 플랫폼(AAV, lyssavirus, Sindbis, HSV 등), 개선된 정맥 전달, 고밀도 CNS 내 주입, 다중 부위 주입을 조합하면 90\% 커버리지가 어렵지만 가능 범위에 들어옵니다.

단백질 염색과 미래의 단백질 시퀀싱

단백질은 모든 세포 활동의 실행자입니다. 커넥톰에 단백질 염색을 결합하면 세포 유형 식별, 시냅스 기능 매핑, 시뮬레이션 입력값 마련에 모두 도움이 됩니다. 초기 표적으로는 PSD-95, BASOON, SHANK-2, 신경필라멘트(NF-L/NF-M/NF-H), Synapsin-1, 갭 접합 마커인 connexins, AMPAR/NMDAR/GABAR 같은 핵심 시냅스 수용체, 그리고 CaMK2 같은 세포 내 신호 단백질이 거론됩니다.

다중 항체 염색과 초해상도를 결합한 현재의 기법은 한 라운드에 10-15 개 표적을 라벨링할 수 있고(Linghu et al., 2020; Seo et al., 2022), PICASSO 같은 다중화(multiplexing) 기법은 라운드당 최대 15 개 표적까지 도달합니다. 30-비트 바코딩, 10 개 단백질 표적, 10 배 다중화를 조합하면 단 4 라운드의 이미징만으로 충분합니다. DNA 기반 FLASH-PAINT처럼 세척 횟수를 줄이거나 빠르게 하는 기법은 다중화와 결합되어 라운드 수를 더 줄일 수 있습니다.

가장 야심찬 미래 기술은 in-situ 단백질 시퀀싱 입니다. 한 세포 안의 수만 개 단백질을 모두 식별하려는 시도로, 1950 년 Edman의 N-말단 아미노산 절단 기법에 뿌리를 두고 있으며, 최근에는 나노 포어 단백질 시퀀싱, 역번역(reverse translation) 기반 시퀀싱, 글래스 플레이트 위 고정 단백질의 고처리량 식별, 팽창 현미경과 다른 초해상도 기법을 결합한 단일 단백질 형태 시각화 등이 연구되고 있습니다. 모든 단백질을 젤에 앵커링한 뒤 Edman 순환 과정을 팽창 현미경과 결합해 반복적으로 아미노산을 식별하는 그림이 가능합니다. 결합제(binder)의 특이성과 체류 시간, 디크라우딩(decrowding) 해상도 같은 어려움이 남아 있지만, 이 기술이 성공한다면 커넥토믹스에서 "염색되는" 단백질 수가 자릿수 단위로 늘어날 수 있습니다.

이 외에도 X선 현미경은 장기적으로 유망한 고처리량 이미징 메커니즘으로 거론됩니다. 싱크로트론의 고휘도 X선 광원에서는 10 nm 해상도가 가능하며, 이미 초파리와 마우스 뇌 조직의 sub-100 nm 이미징과 개별 시냅스의 X선 이미징이 보고되었습니다.

기능적 이미징의 확장: 살아있는 뇌의 활동을 포착하다

커넥톰은 뇌 회로의 놀랍도록 상세한 스냅샷을 제공하지만, 데이터 수집이 사후(post-mortem)에 이루어지므로 살아있는 뇌의 동적 활동 변화를 포착할 수 없습니다. 구조에서 기능으로의 전환이 핵심 도전 과제이며, 한 2019 년 리뷰는 가장 잘 특성화된 모델 유기체인 예쁜꼬마선충 시뮬레이션의 실패 원인을 최소 부분적으로 신경생리학적 데이터의 부족에 귀인했습니다.

모델 유기체별 기능적 이미징 현황

동시에 기록되는 뉴런의 수는 약 7.4 년마다 두 배로 증가해 왔으며, 전극 대신 빛을 사용한 뉴런 활동 추출이 도입되면서 이 속도가 급격히 가속되었습니다.

예쁜꼬마선충(C. elegans): 전체 뇌 또는 전신 칼슘 이미징이 개념 증명 수준으로 달성되었습니다. 2013 년 Schrodel 등이 이광자 여기(two-photon excitation)와 시간적 초점(temporal focusing)을 결합하여 고정된 선충의 머리 뉴런 70\% 에서 4-6 Hz로 칼슘 신호를 기록했으며, 단일 목적 사광면 현미경(SCAPE)은 자유 이동 중인 선충의 전체 신경계를 약 25.75 Hz로 이미징합니다. 하지만 표준화된 전신 활동 데이터셋은 아직 제한적이며, 전압 지시자(voltage indicator)의 구현도 어려운 상태입니다.

유충 제브라피시(Larval Zebrafish): 약 100,000 개 뉴런을 가진 작고 투명한 뇌를 가진 척추동물입니다. 초기 전뇌 칼슘 이미징은 0.8-3 Hz로 동작했으나, ZAPBench 데이터셋은 약 1 Hz에서 제브라피시 뇌 전체의 70,000 개 이상 뉴런에 대한 칼슘 이미징을 시연했습니다. 전뇌 전압 이미징에서는 유충 제브라피시 뉴런의 약 \frac{1}{3} 을 동시에 기록한 최근 연구도 발표되었습니다.

초파리(Drosophila): 성체 초파리 뇌의 조직 산란으로 인해 세포 해상도 전뇌 이미징이 어렵습니다. 이광자 현미경으로 거의 전체 성체 초파리 뇌에서 1.95 Hz로 칼슘 역학을 모니터링한 사례가 있지만 단일 뉴런 해상도는 아닙니다. 네트워크 분석에 따르면 초파리 뉴런 연결은 상당히 정형화되어 있어, 한 개체의 기능 데이터를 다른 개체의 커넥톰에 매핑할 수 있는 가능성이 있습니다.

마우스(Mouse): 광 비드 현미경(Light Beads Microscopy) 이 결정적인 발전을 가져왔습니다. 마우스 등쪽 피질에서 최대 100 만 개 뉴런의 동시 이광자 칼슘 이미징을 2 Hz 세포 해상도로 가능하게 했으며, 'crystal skull' 곡면 유리창을 두개골 대신 장착하면 수술 후 최소 11 주간 30 개 이상 신피질 영역의 약 80 만-110 만 뉴런에 광학적 접근이 가능합니다. 이전 최첨단인 약 75,000 개 동시 기록 뉴런 대비 약 13 배 개선입니다.

인간 규모 기능 이미징: fMRI, MEG, BCI

인간 규모 뇌 이미징은 단일 뉴런 해상도에는 도달하지 못하지만, 메조스케일에서는 fMRI와 MEG 같은 기법으로 활동 지도를 그릴 수 있습니다. fMRI 는 혈중 산소 농도 의존(BOLD) 신호를 측정해 밀리미터 수준 공간 해상도와 초 단위 시간 해상도를 제공하지만, 단일 뉴런의 동역학을 분해하기에는 시간 해상도가 부족합니다. MEG 는 신경 활동이 만들어내는 자기장을 밀리초 수준의 시간 정밀도로 기록하여 보완적 시각을 제공합니다.

침습적 기록의 측면에서는 Neuralink의 N1 임플란트 가 임플란트 후 670 일 이상, 누적 4{,}900 시간 이상의 인간 BCI 사용을 시연했습니다. 광 비드 현미경에 비하면 동시 기록 뉴런 수가 수백 개 수준으로 훨씬 적지만, 인간 대상이라는 점, 그리고 광학 기법으로는 in-vivo 접근이 어려운 깊은 피질 층에서 밀리초 해상도의 스파이크 활동을 포착한다는 점에서 의미가 큽니다.

광학적 한계와 제브라피시의 전략적 위치

빛 기반 칼슘 또는 전압 이미징은 조직 두께와 투명도에 의해 근본적으로 제약됩니다. 산란(scattering)과 흡수(absorption)로 인해 침투 깊이가 1-5 mm로 제한되어, 성체 마우스나 인간의 전뇌 단일 뉴런 이미징은 현재 기술로는 어렵습니다. tartrazine 같은 흡수 분자를 사용해 광학적 투명도를 개선하는 방법이 제안되어 두개골 창 없이도 더 깊은 in-vivo 이미징이 물리적으로 가능할 수 있음을 보여주고 있지만, 아직 초기 단계입니다. Beiran과 Litwin-Kumar(2024)의 초기 시뮬레이션 결과는 제한된 기록 데이터만으로도 전뇌 활동을 예측할 수 있다는 가능성을 시사하며, 이는 일부 경우 전뇌 단일 뉴런 기록이 반드시 필요하지 않을 수도 있음을 의미합니다.

이러한 제약으로 인해 유충 제브라피시는 전략적으로 핵심적인 디딤돌이 됩니다. 이 논문에서 다루는 모델 유기체 중 근미래 기술로 전뇌 단일 뉴런 기능 기록이 실현 가능한 가장 큰 유기체이며, 예쁜꼬마선충에 비해 더 척추동물에 가까운 뇌 구조, 광범위한 신경 가소성, 복잡한 행동과 학습 메커니즘을 갖추고 있습니다. 광범위한 구조적, 기능적, 행동 데이터가 수집되면, 구조적 커넥토믹 데이터, 기능적 전뇌 데이터, 미분 가능한(differentiable) 시뮬레이션 시스템의 완전한 엔드투엔드 통합을 검증하는 유망한 플랫폼이 될 수 있습니다.

시뮬레이션: 컴퓨팅 실현 가능성

뉴런 모델의 복잡도 스펙트럼과 기존 메가 프로젝트

세포 수준 뉴런 모델은 복잡도 스펙트럼을 따라 펼쳐져 있습니다. 한쪽 끝에는 McCulloch-Pitts 이진 모델이나 Izhikevich, Brette/Gerstner의 LIF 류 단순 모델이 있고, 반대쪽 끝에는 다중 구획(multi-compartment) Hodgkin-Huxley 모델과 다상 운동학적 수용체 모델이 있습니다. 시냅스 모델 역시 단순한 전류 기반 지수 함수 시냅스부터 다상 수용체 동역학까지 다양합니다. 어떤 신경 특성을 직접 측정해야 하고 무엇을 추론할 수 있는지, 어떤 추가 제약이 정확한 시뮬레이션에 필요한지는 여전히 활발한 연구 주제입니다.

전 세계적으로 몇몇 메가 프로젝트가 이 문제를 직접 다뤄 왔습니다. Blue Brain Project(BBP) 는 인간 뇌의 디지털 시뮬레이션이라는 거대한 목표 아래 출발했고, 약 31{,}000 개의 쥐 피질 뉴런 모델로 시작해 2024 년 종료 시점에는 비배럴 체감각 피질 4.2 백만 뉴런 모델, 해마 CA1 영역 456{,}000 뉴런 모델을 공개했습니다. 다만 시냅스 수준 커넥톰이 부재한 상황에서 회로 구조의 큰 부분을 계산적으로 채워 넣어야 했고, 이로 인한 한계가 컸습니다. Allen Institute 는 마우스 일차 시각 피질(V1)에서 시작해, 다중 구획 생물물리 모델과 점-뉴런 모델을 결합한 230{,}000 뉴런 V1 모델을 자연주의적 시각 자극으로 구동했고, 이후 일본 슈퍼컴퓨터 Fugaku와 협업하여 약 1{,}000 만 뉴런과 260 억 시냅스, 86 개 뇌 영역을 포괄하는 마우스 시뮬레이션으로 확장했습니다(Kuriyama et al., 2025).

소형 모델 유기체 쪽에서는 OpenWorm 이 예쁜꼬마선충 302 뉴런과 시뮬레이션된 신체 전체를 포괄하는 환경을 만들고자 했고, 후속 프로젝트인 BAAIWorm 은 뇌-신체-환경 상호작용을 모사하는 데이터 주도형 모델로 발전했습니다. 제한된 신경생리학 데이터에도 불구하고 Creamer 등(2024)은 단일 뉴런 광유전 자극 하에서 측정한 전뇌 활동에 커넥톰 제약 선형 모델을 적합시켜, 학습에서 제외된 뉴런들에 대해 상대 상관계수가 최대 0.92 에 이르는 결과를 얻었습니다.

구조에서 기능으로: 커넥톰 기반 시뮬레이션의 가능성

커넥톰이 아무리 상세하더라도 뇌 구조의 정적인 스냅샷일 뿐입니다. 정적인 뇌 구조에서 정확한 뇌 기능을 구동할 수 있는 시뮬레이션으로 어떻게 갈 수 있을까요?

이 질문에 대한 경험적 증거가 쌓이고 있습니다. Shiu 등(2024)은 완전한 초파리 커넥톰에 기반한 시뮬레이션 모델을 개발했습니다. 이 모델은 커넥톰의 실제 신경 연결과 신경전달물질 데이터를 기반으로 1907 년에 개발된 Leaky Integrate-and-Fire(LIF) 뉴런, 즉 단순한 미분 방정식 시스템을 사용했습니다. 구획도 없고, 생물물리학적 세부 사항도 없으며, 초파리 기능 데이터도 거의 사용하지 않았습니다. 그런데도 이 모델은 섭식(feeding), 그루밍(grooming) 등의 회로 수준 행동을 정확히 재현했으며, in-vivo 실험으로 검증되었습니다. "가장 단순한 커넥톰에 분자 정보 없이 100년 된 적분-발화(integrate-and-fire) 방정식으로 제한된 행동을 산출한" 이 결과는 놀라운 경험적 성과입니다.

Lappalainen 등(2024)은 머신러닝과 커넥톰을 결합하여 초파리 시각 시스템의 커넥톰 제약(connectome-constrained) 모델을 만들었습니다. 이 모델은 자연주의적 시각 자극으로부터의 시각적 움직임 계산에 학습되었고, 이전에 실험적으로 결정된 31 개 세포 유형 모두의 대비 선택성(contrast selectivity) 같은 초파리 시각 시스템의 알려진 파라미터를 정확하게 예측했습니다. 20 개 이상의 이전 실험 연구 결과를 재현했고, 시각계 64 개 뉴런 유형의 응답을 예측했습니다. Cowley 등(2024)도 학습에 사용되지 않은 데이터에 대해 인공 뉴런의 응답이 실험적으로 결정된 응답 특성과 일치하는 초파리 시각 시스템 대응 심층 신경망을 만들었습니다.

인터뷰에서 연구자들은 기능 데이터가 적더라도 상세한 구조-기능 모델이 불완전하지만 놀라울 정도로 많은 행동과 일관된 뉴런 활동을 재현할 수 있을 것이라고 잠정적으로 낙관했습니다. 이 낙관의 근거 중 하나는 기능 활동에서 안정적인 뇌 상태가 끌개 공간(attractor space)으로서 얼마나 강건한가에 있습니다: 발작, 마취, 혼수, 둔기 외상, 수면, 수두증, 뇌졸중 회복 등 다양한 조건에서 안정적 뇌 상태로 복귀하는 증거가 이를 뒷받침합니다.

미분 가능한 시뮬레이션과 기능 데이터의 통합

이용 가능한 기능 데이터가 있다면, 이를 활용해 모델을 미세 조정하면 추가적인 정확도 향상을 기대할 수 있습니다. 마우스나 인간 커넥톰이 확보된 이후의 구조-기능 작업은 확장된 Hodgkin-Huxley 또는 Izhikevich 뉴런의 파라미터를 세포 유형별로 다르게 두는 식의 더 정교한 튜닝을 요구할 가능성이 큽니다.

한 가지 제안은 시냅스 구획에 추가적인 전압 의존 항을 더하는 것입니다. 각 항은 해당 시냅스에서 식별된 수용체 클래스를 나타내고, in-vivo 수용체 동역학 실험으로 튜닝되며, 동시에 ExM 기반 광 현미경에서 측정한 수용체 분포로 파라미터 공간이 제약됩니다. 예측 함수와 각 전압 의존 항의 파라미터, 확률 곡선이 모두 매끄럽고 연속이기 때문에, 전체 시스템은 완전히 미분 가능(fully differentiable) 합니다.

이 구조 덕분에 미분 가능한 손실 함수에서 최적값을 찾는 검증된 도구인 경사 하강법(gradient descent) 을 그대로 사용할 수 있습니다(Stanojevic et al., 2024; Chen et al., 2022; Zhang et al., 2023; Deistler et al., 2024). 자유 변수들은 ephaptic 결합 같은 명시적으로 모델링되지 않은 요인까지 암묵적으로 흡수하는 효과를 가집니다. 이상적인 전뇌 단일 뉴런 기능 데이터셋은 예쁜꼬마선충과 유충 제브라피시 같은 일부 유기체에서만 확보 가능하므로, 후자는 구조 커넥톰 데이터, 전뇌 기능 데이터, 미분 가능 시뮬레이션 시스템의 엔드투엔드 통합을 검증하기 위한 핵심 플랫폼이 됩니다. 부분 뇌 슬라이스나 오가노이드 기록, fMRI/MEG/EEG 같은 거친 데이터로 구조-기능 모델을 보강하는 것 역시 가능합니다.

인간 규모 시뮬레이션의 컴퓨팅 요구사항

이 논문은 인간 뇌 에뮬레이션의 컴퓨팅 요구사항에 대한 페르미 추정을 제시합니다.

하한(LIF 뉴런 기반): 8.6 \times 10^{10} 개 뉴런에 대해 밀리초당 약 40 부동소수점 연산을 가정하면, 실시간 시뮬레이션에 40 \times 8.6 \times 10^{10} \times 10^3 \approx 3.4 페타FLOP/s가 필요합니다. 이는 단일 H100급 GPU의 FP16 텐서 처리량(약 1 페타FLOP/s, 구조적 희소성 포함 시 약 2 페타FLOP/s)과 비교 가능한 수준입니다.

상한(Hodgkin-Huxley 뉴런, 1,000 구획, 7,000 시냅스): 구획당 밀리초당 약 690 부동소수점 연산과 10 Hz 평균 발화율에서 스파이크당 약 10^4 연산의 시냅스 통합을 고려하면 약 10^{20} FLOP/s로 추정됩니다. 이는 xAI의 Colossus(100,000 H100 GPU, 약 10^{20} FLOP/s) 같은 차세대 AI 클러스터와 비교 가능한 규모입니다.

중요한 관찰은 컴퓨팅 비용의 대부분이 뉴런 동역학이 아니라 시냅스 모델링에서 발생 한다는 점입니다. 따라서 LIF와 Hodgkin-Huxley 사이의 뉴런당 차이는 시냅스 세부 비용 대비 작을 수 있습니다.

실제 인간 규모 시뮬레이션은 이미 시도되었습니다. Yamazaki 등(2021)은 약 680 억 뉴런(인간 소뇌의 뉴런 수에 해당, 전체 뇌 뉴런의 약 80\%)의 LIF 모델을 11 페타FLOP/s 슈퍼컴퓨터에서 실시간 대비 600 배 느리게 실행했습니다. Lu 등(2024)은 14,012 개 GPU를 동원해 860 억 뉴런과 47.8 조 시냅스의 인간 규모 시뮬레이션을 실행하여 실시간 대비 60-120 배 느린 속도를 달성했습니다. 에뮬레이션이라 부르기에는 너무 조잡하고 단순화되었지만, 역사상 가장 큰 인간 규모 시뮬레이션 시도입니다.

메모리와 인터커넥트가 진정한 병목입니다. 지난 30 년간 처리 능력은 2 년마다 약 3 배 향상된 반면, 메모리와 인터커넥트 대역폭은 각각 1.6 배, 1.4 배에 그쳤습니다. 인간 뇌 에뮬레이션에는 시냅스당 64 바이트와 뉴런당 64 바이트(HPC 오버헤드 2 배 포함)를 가정할 때 총 약 70 페타바이트의 메모리가 필요하며, 100,000 개 GPU에 분산하면 GPU당 약 700 GB입니다. 현재 최상위 GPU의 HBM은 80-192 GB로, 한 자릿수 미만의 격차입니다. 인터커넥트 측면에서는 영리한 분할로 시냅스의 약 10\% 만 GPU 경계를 넘는다고 가정해도, 약 6 \times 10^{13} 개의 GPU 간 시냅스가 남으며, 스파이크 이벤트를 4 바이트 수준으로 압축해도 GPU당 약 24 GB/s가 필요합니다. 빡빡하지만, GPU의 지속적인 메모리 확장과 AI 데이터센터 구축이 역사상 가장 큰 인프라 프로젝트 중 하나가 되어가는 현재, 향후 수십 년 내 해결 가능한 범위입니다.

데이터 저장과 뉴로모픽 하드웨어

데이터 저장 자체도 만만치 않은 도전입니다. 10 nm 등방 해상도에서 1 mm^3 의 뇌 조직은 10^{15} 복셀이며, 복셀당 1 바이트로 약 1 PB의 원시 데이터를 만듭니다. 인간 뇌 전체로 환산하면 압축 전 약 1.4 ZB(제타바이트) 규모입니다. 최신 압축 기법은 약 128 배 압축에서도 재구성을 손상시키지 않는 수준에 도달했으며(Li et al., 2024), 결과적으로 인간 커넥톰의 저장 요구량은 압축 후 약 10-100 PB 범위로 떨어집니다. Backblaze 같은 데이터센터들이 이미 엑사바이트 규모로 데이터를 저장하고 있다는 점을 감안하면, 압축된 요구량은 10-100 배 작은 셈입니다.

비교 기준으로 CERN의 데이터센터는 1 EB 이상의 저장 용량과 100-200 GB/s급 처리량을 보유하며, 건설 비용 약 \$93\text{M}, 연간 운영비 \$100-200\text{M} 수준입니다. CERN의 1/100 규모인 약 10 PB 데이터센터를 짓는다면 초기 비용은 \$10-50\text{M} 수준으로 추정됩니다. Collins 등(2025)은 인간 뇌 원시 이미지 저장에 약 \$2 B을 추정했고, 10 배 압축 시 \$200\text{M} 수준이며, 저장 비용은 10 년마다 약 10 배씩 떨어지는 추세입니다. 결국 시뮬레이션 자체에 필요한 것은 원시 이미지가 아니라 잘 주석된 커넥톰 그래프이므로, 이는 자릿수 단위로 더 작아집니다.

또한 뉴로모픽 시스템(neuromorphic system) 은 비동기, 이벤트 구동 컴퓨팅을 구현하여 대규모 신경 시뮬레이션의 지연 시간과 에너지 소비를 크게 줄일 수 있습니다. 2014 년 IBM의 TrueNorth(칩당 100 만 뉴런, 2.56 억 시냅스), Intel의 Loihi 플랫폼, 그리고 가장 최근 Sandia National Laboratories의 Hala Point(11.5 억 뉴런, 1{,}280 억 시냅스)에 이르기까지 꾸준한 진전이 있었습니다. AI 가속기에 대한 투자가 뉴로모픽보다 자릿수 단위로 크기 때문에 현재는 AI 하드웨어 재활용이 우세하지만, 뉴로모픽과 비-폰노이만 아키텍처는 컴퓨팅, 저장, 메모리, 에너지 요구를 동시에 다루는 유망한 경로로 남아 있습니다.

벤치마킹: 성공을 어떻게 측정할 것인가

'뇌 에뮬레이션이 성공했다는 것을 어떻게 측정할 수 있을까?' 이 질문에 대한 답은 아직 명확하지 않습니다. 단백질 구조 예측이나 날씨 예보와 달리 성공 기준이 잘 정의되어 있지 않은 상황에서, 이 논문은 벤치마킹 하위 분야의 필요성을 강조합니다.

결정론적 메트릭과 그 한계

가장 단순한 출발점은 결정론적 예측입니다. 전뇌 활동 기록에서 C 초를 입력으로 받아 다음 T 초를 예측하고, 뉴런별/프레임별로 활동 벡터를 비교한 평균 오차를 점수로 삼는 방식입니다. ZAPBench 가 정확히 이 정신을 따라 T = 30 초 예측에 대한 평균 절대 오차(MAE)를 메트릭으로 사용하며, 점수는 점멸하는 빛 vs. 사인파 격자 표류 같은 여러 자극 작업에 걸쳐 반복됩니다. 그러나 이런 결정론적 메트릭은 신경 활동의 확률성과 혼돈성을 설명하지 못합니다. 두 시뮬레이션이 비슷한 초기 조건에서 시작하더라도 "나비 효과"로 인해 궤적이 빠르게 갈라지기 때문입니다. 우리의 목표는 주어진 동역학 궤적을 결정론적으로 따라가는 것이 아니라, "개별 동물의 학습된 행동, 기억, 계산을 정확히 포착"하는 것입니다.

확률 분포 매칭

대안은 분포 매칭(stochastic distribution matching) 입니다. 뉴런, 회로, 영역의 활동 분포를 비교하는 것이죠. 예를 들어 어떤 피질 뉴런이 실제로는 평균 10 Hz \pm 5 SD로 발화하는데 시뮬레이션에서는 20 Hz \pm 10 SD로 발화한다면, 분포 차이가 곧 오차가 됩니다. 사용 가능한 분포 거리에는 총 변동 거리(Total Variation Distance), KL 발산, Jensen-Shannon 발산이 있고, Billeh 등(2020)의 마우스 V1 시뮬레이션은 KS 검정 기반 유사도를 사용했습니다. Rimehaug 등(2023)은 50{,}000 뉴런 이상의 생물물리 모델을 사용해 마우스 V1의 시뮬레이션 LFP와 실측 LFP를 정량 비교하며 메조스케일 검증의 가능성을 보여주었습니다. 분포는 뇌 상태(brain state)에 따라 크게 달라지므로, 분포 메트릭은 뇌 상태 또는 자극 분류기와 함께 조건부로 적용하는 것이 가장 의미 있습니다.

행동 메트릭과 임베디드 튜링 테스트

마지막으로 행동 메트릭(behavioral metric) 은 시스템 수준 검증을 제공합니다. 예쁜꼬마선충 모델은 화학주성/온도주성 과제로, 유충 제브라피시 모델은 시각운동(optomotor)이나 광주성(phototaxis) 과제로 검증할 수 있습니다. 자극에 대한 응답 충실도(반사 지연, 동조 곡선, 행동 선택 확률 등)는 신경과 행동 수준을 잇는 중요한 지표입니다. Zador 등(2023)이 제안한 임베디드 튜링 테스트(embodied Turing test) 는 시뮬레이션된 신경계가 동등한 신체(물리적이든 시뮬레이션이든)에 임베드되었을 때 원래 유기체의 행동 레퍼토리를 재현할 수 있는가를 평가하는 프레임워크입니다. 다만 행동 동등성만으로는 메커니즘적 정확성을 보장할 수 없습니다. 룩업 테이블도 행동만 일치시킬 수 있기 때문에, 행동 벤치마크는 신경 수준 메트릭과 결합되어야 합니다.

벤치마크 스위트

AI 분야에서 단일 벤치마크가 모델의 강점을 정의하지 않듯, 뇌 에뮬레이션에서도 벤치마크 스위트(benchmark suite) 가 필요합니다. 시각계 신경망의 평가에 사용되는 Brain-Score (Schrimpf et al., 2020)는 신경 예측력, 행동 정렬, 해부학적 대응을 한꺼번에 본다는 점에서 좋은 모델입니다. 저자는 CASP(단백질 접힘 예측 대회)와 같은 표준화된 대회, 정기적인 워크샵, 단일 메트릭의 포화를 방지하는 진화하는 벤치마크 스위트를 제안합니다.

구체적으로, "성공적인 마우스 뇌 에뮬레이션"이 무엇을 의미하는지 상상해 볼 수 있습니다: 행동 벤치마크 스위트는 새로운 미로에서의 길찾기, 공포 조건화와 소거, 사회적 상호작용 패턴, 일주기 활동 리듬을 포함할 수 있고; 신경 대응 벤치마크는 해마 뉴런이 장소장(place field)을 보이고, 시각 피질 뉴런이 방위 동조를 보이며, 수면 중 리플레이 시 집단 동역학이 기록 패턴과 일치하는지 등을 요구할 것입니다. 가장 까다로운 시험은 개체별 성격 매칭(personality matching), 즉 서로 다른 생물학적 개체의 커넥톰으로부터 초기화된 시뮬레이션 마우스 개체들이 원래 동물에서 관찰된 행동 변동성을 보이는가입니다. 그리고 가장 결정적인 검증은 시뮬레이션이 새로운 예측 을 내고, 그 예측이 실험에서 확인되는 것입니다.

메가 프로젝트: 비용과 타임라인

역사적 메가 프로젝트와의 비교

프로젝트 비용 (인플레이션 조정) 기간
인간 게놈 프로젝트 \$50 13
맨해튼 프로젝트 \$300 3
아폴로 프로그램 \$2,570 8

이러한 범위에 비추어, 인간 규모 커넥토믹스와 시뮬레이션은 인간 게놈 프로젝트와 맨해튼 프로젝트 사이의 투자 규모로, 아폴로 프로그램보다는 적을 것으로 추정됩니다. 인터뷰와 추정에 기반한 대략적 범위는 10-25 년에 걸쳐 50 억-500 억 달러입니다. 인간 게놈 프로젝트가 1980 년대에 불가능하고 낭비적이라는 전문가들의 비판을 받았지만, 소규모 유기체에서의 초기 검증 후 전체 인간 게놈 시퀀싱에 성공한 것처럼, 뇌 에뮬레이션도 예쁜꼬마선충, 유충 제브라피시, 초파리에서의 검증을 거쳐 점진적으로 확장될 수 있습니다.

머신러닝, 자동화, 그리고 AI 클러스터

현대 머신러닝은 비용 절감의 가장 큰 동력입니다. SmartEM 은 영역 난이도에 따라 현미경 체류 시간을 동적으로 조정하여 데이터 수집 시간을 7 배 단축했고(Meirovitch et al., 2024), Google의 Flood-Filling Network과 SegCLR은 커넥토믹스 교정을 혁신하고 있습니다. 인간 교정 비용은 현재 프로젝트 예산의 90\% 이상을 차지하므로, 이 항목의 절감은 전체 비용 곡선을 가장 크게 끌어내립니다. 검출기 단계에서의 ML 기반 데이터 압축은 X선 ptychography 같이 검출기 대역폭에 갇힌 이미징 방식의 데이터 전송 한계를 우회하는 길을 열어줍니다.

머신러닝은 시뮬레이션 자체도 가속합니다. 신경망 대리 모델(surrogate model)은 생물물리적으로 상세한 뉴런 모델의 동역학이나 파라미터를 수치 적분보다 빠르게 근사할 수 있습니다. 더 야심차게는, 커넥톰 제약 신경망이 배선도로부터 직접 신경 활동을 예측하는 길도 열려 있습니다. Lappalainen 등(2024)이 초파리 시각 시스템의 64 개 뉴런 유형 응답을 예측해 20 개 이상의 선행 실험 결과를 재현한 것이 그 예시입니다. 이런 구조-기능 방법이 포유류 회로로 일반화된다면, 대규모 수집이 가장 어려운 기능 데이터의 일부를 대체할 수 있습니다. AI 스케일링 법칙(scaling laws)은 컴퓨팅, 데이터, 파라미터의 멱법칙 함수로 모델 성능이 향상된다는 경험적 사실을 말하는데, 이를 뇌 시뮬레이션에 유추하면 커넥토믹스 처리량, 기능 기록 밀도, 분자 프로파일링의 점진적 개선이 시뮬레이션 충실도의 예측 가능한 향상으로 이어질 수 있습니다.

자동화 역시 모든 단계에서 핵심입니다. 반도체 팹은 좋은 비유입니다: 청소, 식각, 도핑, 적층을 나노미터 정밀도로 하면서도 거의 무인 운영이 가능합니다. 반면 뇌 시료 준비(고정, 절단, 염색, 임베딩)는 비교 가능한 정밀도와 규모를 요구하지만 여전히 대부분 장인 작업입니다. 이 영역의 자동화 라인 전환은 어떤 단일 현미경 또는 재구성 소프트웨어 개선만큼이나 중요합니다. 다운스트림에서도 자동 품질 관리, 수집 중 실시간 분할, 모호한 영역을 다시 스캔하는 폐루프 이미징 시스템이 비용과 오류 누적을 동시에 줄여 줍니다. AI 클러스터가 계속 커지면서 그 용량의 일부를 신경과학 시뮬레이션에 할당하는 한계 비용도 줄어들고 있습니다.

한계점 및 향후 전망

이 논문은 스스로의 한계를 솔직하게 인정합니다. 커넥토믹스를 우회하는 기능적 패러다임 등 에뮬레이션에 대한 비커넥토믹스 접근법, 아직 초기 단계인 구조-기능 추론 방법, X선 현미경 등 새로운 이미징 방식, 디지털 마인드 생성의 윤리적, 법적, 철학적 차원 등을 다루지 못했습니다.

분자 데이터의 격차도 주요 한계입니다. 커넥톰은 배선을 포착하지만, 수용체 유형, 이온 채널 밀도, 신경조절물질 농도, 유전자 발현 프로필은 포착하지 못합니다. 공간 전사체학, in-situ 시퀀싱, 다중 단백질 이미징 등의 기술이 이 격차를 메우기 시작했지만, 전뇌 규모로 확장하는 것은 아직 해결해야 할 과제입니다.

그럼에도, 저자는 분야의 궤적이 질문을 '가능한가'에서 '언제, 어떻게' 로 전환하고 있다고 봅니다. 앞으로의 경로는 단일 문샷이 아니라 서로 맞물리는 성취의 연속입니다: 분자적으로 주석이 달린 완전한 커넥톰, 세포 해상도의 전뇌 기능 기록, 검증된 생물물리학적 시뮬레이션. 각 유기체가 다음 유기체를 위한 시험대가 됩니다.

뇌 에뮬레이션 연구는 현재 심각하게 자금이 부족한 상태입니다. 예쁜꼬마선충 시뮬레이션을 위한 자금 부족 비영리 단체 하나, MIT의 한 대학원생, 프린스턴과 베이징의 두 그룹이 전부입니다. 하지만 AI 인프라에 대한 역사적 규모의 투자가 계속되는 현재, 뇌 에뮬레이션을 위한 컴퓨팅 장벽은 그 어느 때보다 빠르게 낮아지고 있습니다. 이 논문은 신경과학과 AI의 교차점에서 인류가 직면한 가장 야심차면서도 점차 실현 가능해지는 공학적 도전 중 하나를 조망하는 귀중한 지도를 제공합니다.

:scroll: From Worm to Human: Scaling Brain Emulation 논문

Isaak Freeman의 MIT 석사 논문(2026)으로, Ed Boyden 교수의 지도 아래 작성되었습니다.

https://pdf.isaak.net/scaling-emulations

:scroll: State of Brain Emulation Report 2025

이 논문에서 발전한 협업 보고서로, Zanichelli, Schons, Freeman, Shiu, Arkhipov가 공동 저술했습니다.




이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다. :hugs:

:pytorch:파이토치 한국 사용자 모임:south_korea:이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일:love_letter:로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)

:wrapped_gift: 아래:down_right_arrow:쪽에 좋아요:+1:를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~ :star_struck: