时间:2025-10-25 12:35:29来源: 证券之星阅读量:10939
据科技日报报道,23日,华大生命科学研究院与之江实验室联合发布全球首个百亿参数可部署的基因组通用基础模型Genos。该模型支持多达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。
人类基因组由30亿对碱基组成。“人类基因组计划”破译了序列,但序列上碱基的具体功能仍需要精准识别和解析。
现有模型大多基于1—2个参考基因组开展训练,难以体现人类遗传资源的多样性。而Genos整合了人类泛基因组参考联盟、人类基因组结构变异图谱计划(HGSVC)等多个权威公开资源,首次将全球范围内636个“端粒到端粒”级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,有助更全面理解人类遗传多样性。
据悉,Genos模型已在HuggingFace、魔搭等平台全面开源开放,提供12亿和100亿参数两个版本,满足不同需求。
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
Copyright 2005- red.ssrw.cn. All Rights Reserved 网站地图 备案号:皖ICP备2023007381号
版权所有:红人资讯网 本站部分信息资源来自网络转载,如有侵权,请来函说明! 邮箱:boss_11@teag.net