연구 결과물 전반에 걸쳐 출처 문서 섹션을 추적합니다. 체계적 문헌고찰 및 메타분석처럼 동료 심사자나 규제 기관이 각 발견에 대한 관리 연속성을 요구하는 경우, 이 구조적 특성은 주로 정보 검색을 위해 설계된 문서 채팅 도구와의 실질적인 차이점이 됩니다.
기존 도구와 비교하면, Elicit과 Consensus는 과학 논문 데이터베이스에 대한 검색·필터 인터페이스로 구조화된 연구 속성과 함께 관련 논문을 제시합니다. Literature Insights는 검색 이후 단계에서 시작되며, 기존 코퍼스를 수집해 멀티모달 생성과 함께 구조화된 데이터를 출력합니다. 연구 코퍼스로부터 슬라이드 덱과 인포그래픽을 생성하는 것은 Elicit이나 Consensus의 출력 방식이 아닙니다. 이미 문헌 코퍼스를 보유하고 셀 단위 인용 링크와 함께 구조적 합성이 필요한 팀은, 검색 우선 도구로 관련 논문을 찾는 팀과는 다른 워크플로 단계를 다루고 있습니다 .
Literature Insights는 NotebookLM 위에 구축되어 있으므로, 해당 플랫폼의 문서 파싱 인프라를 그대로 계승합니다. 코퍼스 크기 제한, 지원 파일 형식, API 접근 약관은 독립적인 제품 트랙보다는 NotebookLM의 로드맵을 따를 가능성이 높습니다. 프로덕션 통합을 위해 Literature Insights를 평가하는 개발자는 독립적으로 버전이 관리되는 서비스로 간주하기보다 NotebookLM의 API 문서에서 관련 제약 사항을 모니터링해야 합니다.
Co-Scientist: 도전 과제 정의에서 가설 후보 순위 도출까지
Co-Scientist는 가설 생성을 반복적 평가 루프로 구조화하는 멀티 에이전트 Gemini 시스템입니다. 연구자가 도전 과제를 정의하면, Co-Scientist는 Google이 "아이디어 토너먼트"라고 표현하는 과정을 실행합니다. 후보 가설을 생성하고, 에이전트를 배치해 타당성을 논쟁하며, 논리적 결함을 표시하고, 각 가설 내 모든 사실 주장에 클릭 가능한 인용을 제공하며, 여러 라운드를 거쳐 살아남은 가설의 순위를 매깁니다 . 살아남은 가설은 추가 정제를 위해 생성 단계로 다시 피드백됩니다. Co-Scientist 연구 논문은 2026년 5월 19일 Nature에 게재되었으며 , I/O 발표와 동시에 공개되었습니다.
"Co-Scientist는 멀티 에이전트 아이디어 토너먼트를 실행하여, 각 제안의 모든 사실 주장에 클릭 가능한 인용을 달면서 후보 가설을 생성하고 비판하며 반복적으로 정제합니다." — Co-Scientist, Google DeepMind (source: Nature, 2026-05)
초기 실험 하나가 Co-Scientist의 성과를 구체적으로 보여줍니다. 이 시스템은 AK2 유전자 변이와 희귀 유전 질환을 연결하는 잠재적 메커니즘을 식별했으며 , 연구팀은 이를 실험적으로 추구할 만큼 충분히 새로운 결과로 평가했습니다. 프레이밍이 중요합니다. Co-Scientist는 약점이 표시된 후보 가설을 생성하고 순위를 매기며, 실험적 검증은 전적으로 연구자의 책임으로 남습니다. 출력물은 확인된 발견이 아닌 우선순위가 정해진 아이디어 목록입니다.
| 기관 | 분야 | 활용 목적 | 배포 상태 |
|---|---|---|---|
| Daiichi Sankyo | 제약 | 신약 연구 가속화 | 프로덕션 |
| Bayer Crop Science | 농업 | 작물 연구 최적화 | 프로덕션 |
| 미국 국립연구소(DoE Genesis Mission) | 정부 / 다분야 연구 | 과학 연구 가속화 | 프로덕션(대기 명단 면제) |
Daiichi Sankyo와 Bayer Crop Science의 프로덕션 도입은 Co-Scientist가 제약 및 농업 연구 파이프라인에서 프로토타입 단계를 지났음을 확인해 줍니다 . DoE Genesis Mission 파트너십은 구조적으로 주목할 만합니다. 미국 국립연구소는 전용 정부 협약에 따라 일반 대기 명단을 면제받았으며, 이는 가장 컴퓨팅 집약적인 과학 활용 사례가 이미 프로덕션에서 운영 중임을 의미합니다. 이전에 공개된 Co-Scientist 연구는 항균 내성, 식물 면역, 간 섬유화를 다루었으며, 이는 현재 엔터프라이즈 파트너 목록 외의 영역입니다.
공개 자료에서 밝히지 않은 사항은 다음과 같습니다. 아이디어 토너먼트의 에이전트 수, 내부 조정 프로토콜, 지연 시간 프로파일이 공개되지 않았습니다. Co-Scientist를 구동하는 특정 Gemini 모델 버전(2.x 또는 3.x)도 공개 자료에서 명시되지 않았습니다. API를 통해 Co-Scientist 위에 구축하려는 개발자는 Google이 상세한 기술 문서를 공개할 때까지 이를 미지의 사항으로 처리해야 합니다.
ERA와 AlphaEvolve: 병렬 탐색으로 이루어내는 계산적 발견

ERA(Empirical Research Assistance)와 AlphaEvolve는 계산적 발견(Computational Discovery) 레이어를 구성합니다 — Gemini for Science 내에서 과학 소프트웨어를 대규모로 작성하고 최적화하는 구성 요소입니다. ERA는 코드 최적화 연구 엔진으로 작동합니다. 과학적 과제와 사용자가 지정한 최적화 지표를 입력받아 관련 문헌을 검색하고 과학 코드를 작성한 뒤, 수천 가지 코드 변형에 대해 병렬로 트리 탐색을 실행하며 각각을 지표에 따라 평가합니다. 문헌 검색은 별도의 전처리 단계가 아닌 ERA의 최적화 루프에 통합되어 있습니다. ERA의 Nature 논문(2026년 5월 19일 게재) 은 여섯 개 분야 에 걸친 성능을 보고합니다: 유전체학, 공중 보건, 위성 이미지 분석, 신경과학 예측, 시계열 예측, 수학.
일반 LLM 코드 생성과의 실질적인 차이는 탐색 루프 자체에 있습니다. 일반 모델은 프롬프트당 하나의 완성본을 반환합니다. ERA는 코드 변형 트리를 생성하고 이를 모두 도메인별 과학 지표에 따라 평가한 뒤 반복합니다 — 최종 출력은 처음으로 그럴듯하게 완성된 코드가 아니라, 여러 평가 라운드를 거쳐 가장 성능이 높은 변형입니다. 이 설계는 예측 정확도, 유전체 정렬 품질, 모델 효율성 등 정량화 가능한 목표가 있는 최적화 문제에 적합합니다. 작동하는 해결책이라면 무엇이든 수용 기준이 되는 단발성 코딩 작업에는 최적화되어 있지 않습니다.
AlphaEvolve는 다른 메커니즘으로 작동합니다. ERA가 도메인 지표에 대한 경험적 소프트웨어 최적화를 목표로 한다면, AlphaEvolve는 코드와 수학적 구조에 대한 진화 알고리즘 탐색을 적용합니다 — 지표 중심의 코드 최적화보다 수학적 구조 발견에 적합한 더 넓은 탐색 공간입니다. 엔터프라이즈 파트너인 BASF(공급망 최적화)와 Klarna(ML 모델 최적화)는 출시 시점 기준으로 AlphaEvolve의 비공개 미리보기에 참여하고 있습니다 . 두 시스템은 상호 대체 가능하기보다는 상호 보완적입니다: ERA는 측정 가능한 과학 지표에 대한 코드 최적화, AlphaEvolve는 더 넓은 수학적 공간에 대한 구조 탐색을 담당합니다.
계산적 발견 레이어를 평가하는 개발자를 위해: ERA와 AlphaEvolve는 각각 별도의 접근 경로를 가진 것으로 보입니다. AlphaEvolve는 비공개 엔터프라이즈 미리보기 상태이며, Labs 대기 목록과는 별도의 참여 경로가 있음을 시사합니다. ERA는 labs.google/science에서 계산적 발견 레이블 아래 관심 등록을 통해 접근할 수 있는 구성 요소입니다. 향후 릴리스에서 API 인터페이스, 인증 또는 청구를 공유할지 여부는 공개되지 않았습니다. ERA를 구동하는 기반 Gemini 모델 버전도 공개 자료에서 명시되지 않았습니다.
Science Skills: Gemini와 30개 이상의 생명과학 데이터베이스 연결
Science Skills는 Google의 에이전트 오케스트레이션 환경인 Google Antigravity 2.0 내의 구조화된 쿼리 레이어입니다. Gemini를 30개 이상의 생명과학 데이터베이스 와 연결합니다 — UniProt, AlphaFold Database, AlphaGenome API, InterPro 등 — 연구자들이 자연어 인터페이스를 통해 단백질 서열, 예측 3D 구조, 유전체 주석, 단백질 패밀리 분류를 아우르는 쿼리를 실행할 수 있도록 합니다. 세 가지 Labs 도구와 달리 Science Skills는 대기 목록 없이 antigravity.google/use-cases/science에서 즉시 이용할 수 있습니다 .
포지셔닝은 의도적으로 좁게 설정되어 있습니다. Science Skills는 생성형 가설 도구도, 문헌 정리 도구도, 코드 최적화 도구도 아닙니다. 필요한 생물학적 데이터가 무엇인지 이미 알고 있으며 검색과 데이터베이스 간 통합을 Gemini 수준의 자연어로 처리하길 원하는 연구자를 위한 쿼리 오케스트레이션 레이어입니다 — 각 시스템에 대한 별도의 API 호출을 작성하거나 워크플로 중간에 데이터베이스 인터페이스를 전환해야 하는 번거로움을 없애줍니다. 이 통합은 데이터 소스가 명확하고 마찰 요인이 컨텍스트 전환인 구조 생물정보학 및 계산 유전체학 워크플로를 대상으로 합니다.
Labs 도구와의 아키텍처 차이는 도입에 직접적인 영향을 미칩니다. Antigravity 2.0은 에이전트 개발 플랫폼이며, Science Skills는 독립 제품이 아닌 에이전트 스킬로 여기에 통합됩니다. 이미 Antigravity 2.0 위에서 개발 중인 개발자는 기존 에이전트 워크플로에 Science Skills를 즉시 추가할 수 있습니다. 아직 Antigravity 2.0을 사용하지 않는 팀은 Science Skills 구성 요소 자체뿐 아니라 플랫폼을 필수 조건으로 평가해야 합니다 . 이 온보딩 단계는 어떤 평가 일정에서든 반드시 고려해야 합니다.
발행된 성능 결과: ERA vs. CDC 예측 모델 및 공식 기후 기준선

ERA의 발행된 성능 벤치마크는 Gemini for Science 발표에서 가장 구체적인 기술 근거입니다. 미국 내 독감·COVID-19·RSV 병원 입원 예측 전반에서 ERA의 예측은 "CDC 리더보드 상위권에 지속적으로 위치하거나 1위를 차지"했습니다 . 세 가지 호흡기 바이러스 전체에 대한 시즌 평균 정확도에서 ERA는 CDC 자체 COVID-19 입원 예측 앙상블을 능가했습니다 — 모든 참여 예측기관이 측정 기준으로 삼는, 연방 공중보건 기관이 운영하는 벤치마크 모델입니다.
"ERA의 미국 독감·COVID-19·RSV 병원 입원 예측은 CDC 리더보드에서 지속적으로 상위권에 위치하며, 세 가지 호흡기 바이러스 전체에 대한 시즌 평균 정확도에서 CDC 자체 입원 예측 앙상블을 능가했습니다." — ERA 연구팀, Google DeepMind (source: ERA Nature Publication Blog, 2026-05)
| 도메인 | 과제 | ERA 결과 | 참조 기준선 |
|---|---|---|---|
| 역학 | 미국 병원 입원 — 독감, COVID-19, RSV | CDC 리더보드 상위권 또는 1위 | CDC 추적 전체 예측 모델 |
| 역학 | COVID-19 입원 예측 (시즌 평균) | CDC 앙상블 능가 | CDC 자체 앙상블 모델 |
| 수문학 | 캘리포니아 봄철 유출량 예측 | B120 전망보다 정확 | 캘리포니아 공식 B120 계절 예보 |
| 대기과학 | CO₂ 대기 농도 지도화 | 전례 없는 공간·시간 해상도 | 기존 방법 |
| 에너지 | 태양광 패널 설계 최적화 | 500-삼각형 체적 팬 형상 | 기존 기하학적 설계 |
| 유통 | 상업적 예측 정확도 | 컨센서스 추정치 충족 또는 초과 | 상업적 컨센서스 |
여러 벤치마크는 독립적으로 해석 가능합니다. 캘리포니아 B120 전망은 농업 계획과 도시 용수 배분에 활용되는 주(州)의 주요 계절 용수 공급 예보로, 내부 연구용 기준선이 아닙니다. ERA가 B120을 능가했다는 주장은 발행되고 운영상 중요한 예보를 대상으로 한 것입니다 . 태양광 패널 설계 결과 — 최적화 산출물로서의 500-삼각형 체적 팬 형상 — 은 ERA의 트리 탐색 아키텍처가 실제로 무엇을 만들어내는지 잘 보여줍니다. 일반적인 권고안이 아니라, 반복적인 코드 최적화를 통해 도출된 구체적인 공학 설계입니다.
벤치마크 구성 방식은 면밀히 검토할 필요가 있습니다. 보고된 결과는 모두 Google의 Nature 논문과 지원 블로그 게시물에서 나온 것입니다. 동료 심사는 방법론과 내적 일관성을 검증하지만, 독립적인 재현을 의미하지는 않습니다. 2026년 5월 30일 기준으로, ERA의 CDC 성능 또는 캘리포니아 수문학 결과에 대한 독립적 제3자 재현 연구는 아직 발표되지 않았습니다. 이 벤치마크들은 더 넓은 연구 커뮤니티가 평가해 나감에 따라 지속적으로 추적해야 할 항목입니다.
사전 등록 현황과 아직 실험 단계인 것들

세 가지 Google Labs 도구에 대한 관심 등록은 2026년 5월 19일 부터 labs.google/science에서 열려 있습니다. 출시는 단계적으로 진행되며, 일반 등록자 접근 일정은 공개되지 않았습니다. 이름이 명시된 기업 파트너인 Daiichi Sankyo, Bayer Crop Science, BASF, Klarna, 그리고 DoE Genesis Mission 산하 미국 국립연구소들은 이미 대기자 명단 단계를 넘어섰습니다. DoE 파트너십은 별도의 정부 협약에 따라 대기 순서를 완전히 건너뛰었습니다 .
세 가지 Labs 도구 모두 명시적인 "실험적(experimental)" 레이블을 달고 있습니다. 어떤 발행 자료에도 SLA나 프로덕션 준비 완료 보장은 없습니다. Literature Insights, Co-Scientist, Computational Discovery에 대한 가격 체계도 발표된 바 없습니다. 이는 Google Labs의 표준 실험적 출시 방식과 일치하지만, 프로덕션 연구 파이프라인에 이 도구들을 도입하려는 팀은 API 접근 조건, 요청 제한, 비용 구조가 추후 공개될 것임을 감안해 계획을 세워야 합니다.
Science Skills는 예외입니다. Google Antigravity 2.0을 통해 즉시 이용 가능하며, 실험적 레이블이 없고 대기자 명단도 필요 없습니다. 지금 당장 Gemini 수준의 쿼리 통합이 필요한 구조화된 생물학 데이터베이스 작업 팀에게 Antigravity 2.0이 현재의 진입점입니다 .
출시 시점 기준으로 여러 기술적 세부 사항이 아직 공개되지 않았습니다. Co-Scientist와 ERA를 구동하는 Gemini 모델 버전, 아이디어 토너먼트의 내부 에이전트 조율 아키텍처, ERA의 벤치마크 외 일반화 검증 인프라가 그것입니다. 100개 이상의 학술 기관 이 이 제품군의 검증에 협력하고 있으며, 명시된 파트너로는 스탠퍼드 의과대학, 임페리얼 칼리지 런던, 프랜시스 크릭 연구소가 포함됩니다 . 이들 파트너의 독립적인 검증 결과는 향후 수개월 내에 나올 것으로 예상되며, 발행된 벤치마크가 Google 자체 평가 인프라 밖에서도 유효한지 여부를 가장 명확하게 보여줄 것입니다.
자주 묻는 질문
Gemini for Science는 일반 Gemini를 연구에 활용하는 것과 어떻게 다른가요?
Gemini for Science는 표준 Gemini 제품이나 API에서는 제공되지 않는 세 가지 전용 시스템을 묶어 제공합니다. Literature Insights는 업로드된 자료집에서 도출된 연구 결과를 인용 연결된 증거 표로 구조화하고, 슬라이드와 인포그래픽을 생성합니다. 표준 Gemini는 셀 단위 출처 추적 없이 산문 형태의 요약만 반환합니다. Co-Scientist는 에이전트들이 후보 가설을 생성·토론·순위화하는 다중 라운드 가설 토너먼트를 실행합니다. 표준 Gemini는 프롬프트에 대해 단일 응답만 생성합니다. ERA는 사용자 정의 과학적 지표로 평가한 수천 개의 코드 변형에 대해 트리 탐색을 수행합니다. 표준 Gemini의 코드 생성은 프롬프트당 완성본 하나만 반환합니다. 이 기능들 중 어느 것도 표준 Gemini 인터페이스나 범용 Gemini API를 통해서는 접근할 수 없습니다.
ERA는 일반 LLM 코드 생성과 무엇이 다른가요?
일반 LLM 코드 생성은 프롬프트당 코드 완성본 하나를 반환합니다. ERA는 수천 개의 코드 변형을 병렬로 트리 탐색하고, 각각을 사용자 정의 최적화 지표로 평가하며, 반복적으로 개선합니다. 논문 검색이 루프 내에 통합되어 있어, ERA는 관련 논문을 읽고 그 문헌에 기반한 코드 변형을 생성한 뒤 지표로 평가하고 정제합니다. 출력 결과는 처음으로 그럴듯한 완성본이 아니라, 수많은 평가 라운드를 거친 최고 성능 변형입니다. 따라서 ERA는 정량화 가능한 목표(예보 정확도, 유전체 정렬 품질, ML 모델 성능)가 있는 과학적 최적화 문제에 적합하며, 어떤 작동하는 해법이든 기준을 충족하는 단발성 작업에는 맞지 않습니다.
Co-Scientist는 지금 사용할 수 있나요, 아니면 대기자 명단이 있나요?
Co-Scientist 관심 등록은 2026년 5월 19일 labs.google/science에서 시작되었습니다. 배포는 단계적으로 이루어지며, 신규 등록자가 언제 접근권을 받을지에 대한 일정은 공개되지 않았습니다. 공식 엔터프라이즈 파트너인 Daiichi Sankyo, Bayer Crop Science, 미국 에너지부(DoE) Genesis Mission 산하 국립연구소는 일반 대기열을 우회하거나 선점해 이미 프로덕션 단계에 있습니다. Google Antigravity 2.0의 Science Skills는 별도 등록 없이 즉시 이용 가능하지만, 이는 Co-Scientist의 가설 생성 시스템이 아닌 구조화된 생물학 데이터베이스 쿼리 레이어입니다. 두 도구는 기능과 접근 경로가 완전히 다릅니다.
Literature Insights는 Elicit이나 Consensus 같은 도구와 어떻게 다른가요?
Elicit과 Consensus는 주로 검색·필터 인터페이스입니다. 대규모 인덱싱된 데이터베이스에서 구조화된 연구 속성과 함께 관련 논문을 찾아주는 역할을 합니다. Literature Insights는 검색 이후 단계에서 시작됩니다. 업로드된 자료집을 대상으로 연구 결과를 셀 단위 출처 링크가 포함된 구조화된 증거 표로 매핑합니다. 연구 자료집에서 직접 슬라이드 덱과 인포그래픽을 생성하는 멀티모달 출력 기능은 Elicit이나 Consensus 어느 쪽도 제공하지 않는 역량입니다. 이미 문헌 자료집을 보유하고 있으며 출력 전반에 걸쳐 인용 추적이 가능한 구조적 합성이 필요한 팀은, 관련 논문을 먼저 찾는 검색 우선 도구를 사용하는 팀과는 워크플로의 단계 자체가 다릅니다. 공개된 분석에 따르면, 표 생성과 멀티모달 출력이 핵심 차별화 역량입니다.
Google Antigravity 2.0은 무엇이며, Science Skills는 어떤 위치인가요?
Google Antigravity 2.0은 antigravity.google에서 접근할 수 있는 Google의 에이전트 오케스트레이션 환경입니다. Science Skills는 Antigravity 2.0 내의 에이전트 스킬 집합으로, Gemini를 UniProt, AlphaFold Database, AlphaGenome API, InterPro 등 30개 이상의 생명과학 데이터베이스에 구조화된 데이터 쿼리 레이어로 연결합니다. 세 가지 실험적 Labs 도구와 달리, Science Skills는 대기자 명단 없이 즉시 이용 가능합니다. 각 데이터 소스마다 별도의 API 파이프라인을 작성하지 않고도 구조화된 생물학 데이터베이스 전반을 Gemini 수준의 자연어로 쿼리해야 하는 연구자를 대상으로 합니다. Antigravity 2.0은 독립 제품이 아닌 플랫폼 전제 조건입니다. Antigravity 2.0에 아직 온보딩하지 않은 개발자는 Science Skills를 평가하기 전에 해당 온보딩 단계를 일정에 반영해야 합니다. Creati.ai의 보도에서 Antigravity 플랫폼 포지셔닝에 대한 추가 맥락을 확인할 수 있습니다.
지금 활용할 도구, 앞으로 지켜볼 지점
Gemini for Science는 Google이 수년간 쌓아온 최전선 AI 투자를 연구 생애주기에 실질적으로 배포한 가장 의미 있는 성과입니다. ERA와 Co-Scientist는 동료 심사를 거친 Nature 논문과 함께, Daiichi Sankyo·Bayer Crop Science·미국 국립연구소에서 이미 프로덕션 배포 중입니다. 미래 기능으로 발표된 것이 아닙니다. Literature Insights는 NotebookLM의 검증된 문서 지능을 셀 단위 인용 추적이 가능한 구조화된 증거 표로 확장합니다. Science Skills는 Antigravity 2.0을 이용 중인 팀에게 대기자 명단 없이 즉시 생물학 데이터베이스 통합을 제공합니다.
연구 엔지니어링 팀을 위한 실질적인 구분은 명확합니다. Antigravity 2.0의 Science Skills는 지금 즉시 사용 가능하며 구조화된 생물학 데이터베이스 쿼리를 대상으로 합니다. Literature Insights·Co-Scientist·ERA 등 세 가지 Labs 도구는 labs.google/science에서 관심 등록이 필요하며, 단계적 배포가 이루어지고 가격은 공개되지 않았습니다. 제약사나 국립연구소 규모의 엔터프라이즈 팀은 일반 등록 대기열보다 DoE Genesis Mission과 기존 파트너 참여 트랙을 직접 문의하는 것이 낫습니다. AlphaEvolve는 현재 비공개 엔터프라이즈 프리뷰 단계이며, BASF와 Klarna가 현재 접근권을 보유하고 있습니다. I/O 2026 전체 발표 맥락은 Gemini for Science를 Gemma V4 오픈 웨이트 및 MedGemma와 함께 이루어진 더 광범위한 행보 속에 자리매김합니다.
향후 6개월간 가장 중요하게 추적해야 할 신호는 벤치마크입니다. ERA의 CDC 예측 성능과 캘리포니아 유출량 정확도는 동료 심사 저널에 게재된 구체적이고 검증 가능한 주장입니다. 독립 연구 그룹들이 해당 결과를 재현하고, Stanford 의과대학·임페리얼 칼리지 런던·Francis Crick Institute가 검증 결과를 발표함에 따라, 후속 논문들이 Google 자체 평가 인프라 밖에서도 그 성능이 유지되는지를 판가름할 것입니다. 연구 활용 목적이 직접적으로 관련된다면 지금 바로 관심 등록을 하되, 독립적인 검증이 나오는 시점에 맞춰 공개된 수치에 대한 신뢰도를 조율해 나가시기 바랍니다.
최종 업데이트: 2026-05-30. Google I/O 2026 발표 자료 및 2026년 5월 19일 게재된 Nature 논문을 기반으로 작성. 이 날짜 기준으로 ERA 또는 Co-Scientist 벤치마크에 대한 독립적인 제3자 재현 결과는 발표되지 않았습니다.