바이오 파운데이션 모델Bio foundation model
-
기술 정의
대규모 생물학적 데이터를 학습하여 생명 현상을 예측하고 새로운 원리를 추론하여 생명과학 작업을 자동화하고 최적화하는 범용 인공지능 모델
-
기술장점
새로운 생체 분자 설계와 신약 후보 발굴뿐만 아니라, 작물의 유전자 개선, 오염 물질의 생물학적 처리 최적화, 생체 기반 소재 개발 등 다양한 작업에서 높은 정확도와 효율성을 제공
-
실현 시기
향후 5년 : 모델구축 및 초기상용화: 신약개발 및 단백질 설계, 희귀질환, 암질환 데이터 활용, 자동화 기술 확산: 대규모 유전체 및 단백질 데이터 기반 모델 도입으로 인간 개입을 최소화하고 비전문가도 실험 설계와 데이터 분석이 가능
향후 10년 : 유전체, 단백체 등 데이터를 통합 처리하여 질병 예측과 치료 설계를 정밀화하고, 설계부터 검증까지 자율 운영해 약물 개발 주기를 단축, 환자 맞춤형 치료, 작물 생산성 향상 등 다양한 응용으로 확산
-
요소 기술
■ (대규모 데이터 학습 기술) 대규모 생물학적 데이터를 학습하여 복잡한 상호작용을 이해하고 예측. 유전체, 단백질, 임상 데이터 등 이질적 데이터를 통합 처리하여 동시에 학습 가능
■ (거대언어모델 기반 단백질 및 분자 설계 기술) 단백질 구조와 기능 예측, 단백질-분자 간 상호작용 분석으로 신약 개발 지원. 분자 구조 데이터를 학습하여 약물 결합 가능성을 예측하고 최적화
■ (자연어 처리 기반 데이터 해석) DNA, RNA, 단백질 데이터를 인간 언어처럼 학습해 돌연변이와 생물학적 영향을 예측. 대규모 생물학적 데이터를 학습하고 서열 패턴과 구조를 분석
■ (고속 자동화 및 처리 기술) 고속 시퀀싱으로 데이터 수집과 통합 처리, 실시간 업데이트 가능. 생물학적 시스템의 디지털 복제본으로 동적 상호작용과 질병 진행 예측
■ (맞춤형 모델 및 파인튜닝 기술) 특화 데이터를 기반으로 모델을 조정해 특정 도메인 요구 충족. 제약·바이오 분야의 특정 목적에 맞춘 모델 설계
■ (신뢰성 및 윤리적 요소 관리) 비지도 학습에서 발생하는 데이터 편향 문제를 완화하고 성능 검증 기준을 마련해 연구와 산업 활용도를 높임 -
주요 이슈
■ (기술적 니즈) - 희귀질환 및 특정 생태계 데이터 부족으로 인해 모델 성능이 제한되며, 데이터 품질과 편향성 문제 - 복잡한 신경망의 의사결정 과정이 불투명해 신뢰성을 저하시켜, 해석 가능한 AI 설계가 필요 - 유전체, 단백체 등 이질적 데이터를 통합 처리하기 위한 상호운용성 기술이 발전 중 ■ (경제적 니즈) - 고성능 컴퓨팅 리소스와 대규모 데이터 저장소로 인한 높은 초기 투자 비용이 요구 - 상용화를 위해 데이터 보안, 사용자 맞춤화 등 추가 소프트웨어 및 인프라 비용이 발생 - 긴 개발 주기로 인해 투자 수익 실현 시점이 불확실하며, ROI가 명확하지 않음 ■ (사회적 니즈) - 유전체 데이터 등 민감한 정보를 처리하는 데 있어 프라이버시 보호와 규제 강화가 필요 - AI 모델에 대한 신뢰 부족과 결과 해석의 어려움이 실용화를 방해 - 경제적 격차로 인해 저소득 국가에서 데이터 접근성과 활용이 제한될 가능성
-
해외 기술개발동향
■ (Tx-LLM) 구글 딥마인드가 개발한 치료 특화 거대언어모델로, 약물 개발 전 과정을 통합하고 복잡한 문제를 해결하는 데 초점
■ (NVIDIA BioNeMo) 생명과학과 헬스케어 분야를 위한 생성형 AI 기반 신약 개발 플랫폼으로, 단백질 구조 예측, 분자 생성, 약물-단백질 결합 구조 예측 등 다양한 작업을 지원하며 Clara 플랫폼의 일부로 제공
■ (Med-PaLM2) 구글의 Flan-PaLM을 의료 도메인에 특화한 모델로, 3400억 파라미터를 통해 의료 데이터 이해와 활용을 목표로 하며, 전문가 지식 기반의 성능 개선을 통해 활용성을 높임 -
국내 기술개발동향
■ (테라젠바이오) 서울대병원과 협력하여 희귀질환 특화 거대언어모델을 개발 중으로, 소아 희귀질환 데이터와 최신 연구 결과를 통합해 트랜스포머 기반 LLaMA 모델을 파인튜닝하여 희귀질환 치료 개선을 목표로 함
■ (KAIST 디지털 바이오헬스 AI 연구센터) 바이오 의료 영상, 임상기록, 유전체/오믹스 데이터 등 생성형 AI 원천 모델 개발을 목표로 연구 중
■ (국내 제약사) NVIDIA BioNeMo 플랫폼을 통해 실험을 줄이고 AI 기반 약물 연구·개발을 진행 중
■ (정부의 의료데이터 표준화 노력) 보건의료 빅데이터 플랫폼 구축으로 전자의무기록, 유전체 정보 등을 통합하여 분석 가능한 환경을 조성, 국내 바이오와 헬스케어 분야의 파운데이션 모델 개발과 활용을 촉진 -
경제산업적 기대효과
■ (경제적 기대효과) 신약 설계, 스크리닝, 최적화를 가속화하여 개발 비용을 절감하고, 생물학적 데이터를 더 빠르고 저렴하게 처리해 연구 및 임상 비용을 낮춤■ (산업적 기대효과) 단백질 설계, RNA 치료제 개발, 유전자 편집 등 신규 산업 창출과 부가가치 상승, 디지털 헬스케어, 정밀의학 등 융합 분야 발전을 통해 고용창출과 연구 속도 향상
-
사회적 기대효과
■ 질병 관리와 연구 효율성: 개인 유전체 기반으로 질병 원인을 정확히 이해하고 맞춤형 치료 설계, 질병 발병 확률 예측, 공중보건 데이터 분석을 통한 관리 효율 향상■ 연구와 교육 지원: 대규모 데이터 활용으로 연구 접근성을 높이고, 생명과학 교육 및 바이오 데이터 과학 교육 수준을 향상
-
필요 사항
■ 데이터 통합과 플랫폼 구축: 연구기관과 기업의 데이터 접근성을 높이는 국가 바이오 데이터 허브 설립 필요■ 인재 육성과 연구기관 설립: 생명공학 AI 전문 인력을 양성하고 바이오 파운데이션 모델 개발을 전문으로 하는 연구기관 설립 추진■ 오픈소스와 중소기업 지원: 바이오 파운데이션 모델 관련 연구 결과를 공개해 중소기업과 스타트업의 기술 접근성을 강화■ 윤리적 기준과 신뢰성 확보: 개인 데이터 프라이버시 보호, 윤리적 기준 수립, 안전성 검증 체계를 마련해 의료 및 제약 분야 활용도를 높임
-
BICS·BioIN 연계 데이터
BICS 연계데이터가 없습니다.
BioIN 연계데이터가 없습니다.
(단위 : 백만원)
검색일 : 2024-11-25 | 출처:NTIS에서 관련 연구과제 검색
연도 | 정부연구비(백만원) | 과제수 |
---|---|---|
2024년 | 2,755.22 | 7건 |
2023년 | 352.5 | 2건 |
관련 R&D 과제 정보 9 건
NO | 과제명 | 연구수행기관 | 과제수행연도 | 부처명 | 사업명 | 내역사업명 | 정부투자비(백만원) | 과제고유번호 |
---|---|---|---|---|---|---|---|---|
1 | 영상-언어 다중 모달리티 이해를 통한 개별 환자 맞춤형 방사선 치료 설계 보조 인공지능 개발 | 연세대학교 | 2023 | 교육부 | 이공학학술연구기반구축 | 창의도전연구기반지원 | 52.5 | 1345371352 |
2 | 의료영상 초음파 인공지능 파운데이션 모델 개발 | 연세대학교 | 2024 | 과학기술정보통신부 | 개인기초연구(과기정통부) | 우수연구-신진연구/세종과학펠로우십(국외연수트랙) | 73.5 | 2710019056 |
3 | 유전자 간 상호작용 및 조절 관계 규명을 위한 단일세포 전사체 파운데이션 모델 구축 방법론 개발 | 포항공과대학교 | 2024 | 교육부 | 이공학학술연구기반구축 | 석사과정생연구장려금지원사업 | 6 | 2340011979 |
4 | 미래의 눈 및 전신 질환 발생 예측을 위한 안저사진 중심의 맞춤형 인공지능생태계 구축 | 서울대학교병원 | 2024 | 과학기술정보통신부 | 개인기초연구(과기정통부) | 우수연구-중견연구(유형1) | 229.75 | 2710004625 |
5 | 마이크로소프트연구소와 공동연구협력 프로젝트 | 한국마이크로소프트(유한) | 2024 | 과학기술정보통신부 | 디지털분야글로벌인재양성(R&D) | 디지털분야글로벌연구지원 | 2,000 | 2710008309 |
6 | 영상-언어 다중 모달리티 이해를 통한 개별 환자 맞춤형 방사선 치료 설계 보조 인공지능 개발 | 연세대학교 | 2024 | 교육부 | 이공학학술연구기반구축 | 창의도전연구기반지원 | 54.6 | 2340000175 |
7 | 동물-사람 멀티스케일 신경과학 파운데이션 모델을 기반으로한 뇌-외부환경 상호작용시의 정서에 의해 맥락화된 (contextualized) 지각의 디코딩 | 서울대학교 | 2023 | 과학기술정보통신부 | 뇌과학선도융합기술개발 | 미래선점형(2유형) | 300 | 1711198565 |
8 | 당뇨병 환자의 치료/합병증 예측을 위한 다중차원 바이오마커 선별 및 AI-Foundation Model 구축 | (서울)경희대학교산학협력단 | 2024 | 교육부 | 이공학학술연구기반구축 | Post-Doc 성장형 공동연구 | 150 | 2340012862 |
9 | 멀티모달 의료영상을 이용한 대동맥판막 협착증의 진단, 치료, 예후 예측을 위한 전주기적 인공지능 기반 진단보조 시스템 개발 및 검증 | 계명대학교 산학협력단 | 2024 | 과학기술정보통신부 | 개인기초연구(과기정통부) | 우수연구-신진연구/우수신진 | 241.37 | 2710004866 |
(단위 : 백만달러)
검색일 : 2024-09-25 | 출처:Dimensions AI에서 관련 연구과제 검색
연도 | 연구비(백만달러) | 과제수 |
---|---|---|
2024년 | 7190.0 | 25410건 |
2023년 | 7590.0 | 28747건 |
2022년 | 7210.0 | 28554건 |
2021년 | 6770.0 | 27855건 |
2020년 | 5850.0 | 26941건 |
2019년 | 5220.0 | 25033건 |
2018년 | 4720.0 | 22681건 |
2017년 | 4290.0 | 20883건 |
2016년 | 4060.0 | 19561건 |
2015년 | 3810.0 | 18249건 |
최근 등록일 : 2024-11-25 | 출처: NTIS에서 관련 연구과제 검색
최근 등록일 : 2024-11-25 | 출처: NTIS에서 관련 연구과제 검색
관련 R&D 과제 정보   9 건
NO | 과제명 | 연구수행주체 | 과제수행연도 | 부처명 | 사업명 | 내역사업명 | 정부투자비(벡만원) | 과제고유번호 | |
---|---|---|---|---|---|---|---|---|---|
1 | 영상-언어 다중 모달리티 이해를 통한 개별 환자 맞춤형 방사선 치료 설계 보조 인공지능 개발 | 연세대학교 | 2023 | 교육부 | 이공학학술연구기반구축 | 창의도전연구기반지원 | 52500000 | 52.5 | 1345371352 |
2 | 의료영상 초음파 인공지능 파운데이션 모델 개발 | 연세대학교 | 2024 | 과학기술정보통신부 | 개인기초연구(과기정통부) | 우수연구-신진연구/세종과학펠로우십(국외연수트랙) | 73500000 | 73.5 | 2710019056 |
3 | 유전자 간 상호작용 및 조절 관계 규명을 위한 단일세포 전사체 파운데이션 모델 구축 방법론 개발 | 포항공과대학교 | 2024 | 교육부 | 이공학학술연구기반구축 | 석사과정생연구장려금지원사업 | 6000000 | 6 | 2340011979 |
4 | 미래의 눈 및 전신 질환 발생 예측을 위한 안저사진 중심의 맞춤형 인공지능생태계 구축 | 서울대학교병원 | 2024 | 과학기술정보통신부 | 개인기초연구(과기정통부) | 우수연구-중견연구(유형1) | 229750000 | 229.75 | 2710004625 |
5 | 마이크로소프트연구소와 공동연구협력 프로젝트 | 한국마이크로소프트(유한) | 2024 | 과학기술정보통신부 | 디지털분야글로벌인재양성(R&D) | 디지털분야글로벌연구지원 | 2000000000 | 2,000 | 2710008309 |
6 | 영상-언어 다중 모달리티 이해를 통한 개별 환자 맞춤형 방사선 치료 설계 보조 인공지능 개발 | 연세대학교 | 2024 | 교육부 | 이공학학술연구기반구축 | 창의도전연구기반지원 | 54600000 | 54.6 | 2340000175 |
7 | 동물-사람 멀티스케일 신경과학 파운데이션 모델을 기반으로한 뇌-외부환경 상호작용시의 정서에 의해 맥락화된 (contextualized) 지각의 디코딩 | 서울대학교 | 2023 | 과학기술정보통신부 | 뇌과학선도융합기술개발 | 미래선점형(2유형) | 300000000 | 300 | 1711198565 |
8 | 당뇨병 환자의 치료/합병증 예측을 위한 다중차원 바이오마커 선별 및 AI-Foundation Model 구축 | (서울)경희대학교산학협력단 | 2024 | 교육부 | 이공학학술연구기반구축 | Post-Doc 성장형 공동연구 | 150000000 | 150 | 2340012862 |
9 | 멀티모달 의료영상을 이용한 대동맥판막 협착증의 진단, 치료, 예후 예측을 위한 전주기적 인공지능 기반 진단보조 시스템 개발 및 검증 | 계명대학교 산학협력단 | 2024 | 과학기술정보통신부 | 개인기초연구(과기정통부) | 우수연구-신진연구/우수신진 | 241370000 | 241.37 | 2710004866 |
관련 R&D 과제 논문 성과
(단위 : 건)
최근 등록일 : | 출처:NTIS 관련 연구과제의 논문성과 검색
검색된 논문이 없습니다. |
관련 R&D 과제 논문 성과 건
NO | 논문명 | 저널명 | 저자 | 발행년도 |
---|---|---|---|---|
관련 R&D 과제 논문 성과
(단위 : 건)
최근 등록일 : | 출처:ScienceON에서 관련 논문 검색
검색된 논문이 없습니다. |
관련 R&D 과제 특허 성과
(단위 : 건)
최근 등록일 : | 출처:NTIS 관련 연구과제의 특허성과 검색
검색된 특허가 없습니다. |
관련 R&D 과제 특허 성과 건
NO | 특허명 | 출원기관 | 출원국가 | 출원일자 |
---|---|---|---|---|
관련 글로벌 특허 성과
(단위 : 건)
최근 등록일 : | 출처:ScienceON에서 관련 특허 검색
검색된 특허가 없습니다. |
관련 R&D 과제 특허 성과 건
NO | 특허명 | 출원인 | 출원국가 | 출원일자 |
---|---|---|---|---|
출처 : NTIS 관련 연구과제로 ZEUS 등록 연구장비 검색
관련 장비/분석 서비스
발전흐름
관련 R&D 과제 정보 9 건
과제수행연도 | 부처명 | 사업명 | 과제명 | 과제고유번호 | 총연구비 합계(원) | 연구개발단계 | 연구수행주체 | 과제수행기관명 | 대분류 | 중분류 | 소분류 | 논문 | 특허 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2023 | 교육부 | 이공학학술연구기반구축 | 영상-언어 다중 모달리티 이해를 통한 개별 환자 맞춤형 방사선 치료 설계 보조 인공지능 개발 | 1345371352 | 52500000 | 기초연구 | 대학 | 연세대학교 | 0건 | 0건 | |||
2024 | 과학기술정보통신부 | 개인기초연구(과기정통부) | 의료영상 초음파 인공지능 파운데이션 모델 개발 | 2710019056 | 73500000 | 개발연구 | 대학 | 연세대학교 | 0건 | 0건 | |||
2024 | 교육부 | 이공학학술연구기반구축 | 유전자 간 상호작용 및 조절 관계 규명을 위한 단일세포 전사체 파운데이션 모델 구축 방법론 개발 | 2340011979 | 6000000 | 기초연구 | 대학 | 포항공과대학교 | 0건 | 0건 | |||
2024 | 과학기술정보통신부 | 개인기초연구(과기정통부) | 미래의 눈 및 전신 질환 발생 예측을 위한 안저사진 중심의 맞춤형 인공지능생태계 구축 | 2710004625 | 229750000 | 기초연구 | 기타 | 서울대학교병원 | 0건 | 0건 | |||
2024 | 과학기술정보통신부 | 디지털분야글로벌인재양성(R&D) | 마이크로소프트연구소와 공동연구협력 프로젝트 | 2710008309 | 2000000000 | 기초연구 | 중견기업 | 한국마이크로소프트(유한) | 0건 | 0건 | |||
2024 | 교육부 | 이공학학술연구기반구축 | 영상-언어 다중 모달리티 이해를 통한 개별 환자 맞춤형 방사선 치료 설계 보조 인공지능 개발 | 2340000175 | 54600000 | 기초연구 | 대학 | 연세대학교 | 0건 | 0건 | |||
2023 | 과학기술정보통신부 | 뇌과학선도융합기술개발 | 동물-사람 멀티스케일 신경과학 파운데이션 모델을 기반으로한 뇌-외부환경 상호작용시의 정서에 의해 맥락화된 (contextualized) 지각의 디코딩 | 1711198565 | 300000000 | 기초연구 | 대학 | 서울대학교 | 0건 | 0건 | |||
2024 | 교육부 | 이공학학술연구기반구축 | 당뇨병 환자의 치료/합병증 예측을 위한 다중차원 바이오마커 선별 및 AI-Foundation Model 구축 | 2340012862 | 150000000 | 기초연구 | 대학 | (서울)경희대학교산학협력단 | 0건 | 0건 | |||
2024 | 과학기술정보통신부 | 개인기초연구(과기정통부) | 멀티모달 의료영상을 이용한 대동맥판막 협착증의 진단, 치료, 예후 예측을 위한 전주기적 인공지능 기반 진단보조 시스템 개발 및 검증 | 2710004866 | 241370000 | 기초연구 | 대학 | 계명대학교 산학협력단 | 0건 | 0건 |
관련 R&D 과제 논문정보
건
NO | 논문명 | 저널명 | 저자 | 발행년도 |
---|---|---|---|---|
상세정보:
출원번호 | 출원일자 | 초록 | IPC코드 | 공개일자 | 공개번호 | 공고일자 | 공고번호 | 등록일자 | 등록번호 | 등록상태 |
---|---|---|---|---|---|---|---|---|---|---|
검색된 특허가 없습니다. |
상세정보:
출원번호 | 출원일자 | 문헌번호 | 출원인명 | 발명자명 | 대리인명 | IPC코드 | 공고번호 | 공보번호 | 등록번호 | 우선권주장번호 |
---|---|---|---|---|---|---|---|---|---|---|
검색된 특허가 없습니다. |