OpenAI 推出 GeneBench-Pro 基准测试，用于评估 AI 模型生物学计算能力

主队	比分	客队	联赛	时间(北京)
第比利斯 2025	0:0	贝特莱米·凯达	格鲁吉亚联赛3	18:00
内盖勒·阿尔西	0:0	哈瓦萨·凯内马	埃塞俄比亚足球超级联赛	18:00

主队

比分

客队

联赛

时间(北京)

第比利斯 2025

0:0

贝特莱米·凯达

格鲁吉亚联赛3

18:00

内盖勒·阿尔西

0:0

哈瓦萨·凯内马

埃塞俄比亚足球超级联赛

18:00

主队	比分	客队	联赛	时间(北京)
尼姆布尔克篮球俱乐部	—	帕尔杜比采篮球俱乐部	捷克国家篮球联赛	23:00
费内巴切篮球俱乐部	—	贝西克塔斯篮球俱乐部	土耳其篮球超级联赛	01:00
希洛纳戈拉篮球俱乐部	—	华沙莱吉亚	波兰篮球联赛	02:15
普瓦捷 86 篮球队	—	埃兰·贝阿奈斯	法国国家篮球联赛B	02:30
布兰普顿蜜獾队	—	尼亚加拉河狮队	加拿大精英篮球联赛	07:30
多伦多 tempo	77:102	亚特兰大梦想队	WNBA	03:00

主队

比分

客队

联赛

时间(北京)

尼姆布尔克篮球俱乐部

—

帕尔杜比采篮球俱乐部

捷克国家篮球联赛

23:00

费内巴切篮球俱乐部

—

贝西克塔斯篮球俱乐部

土耳其篮球超级联赛

01:00

希洛纳戈拉篮球俱乐部

—

华沙莱吉亚

波兰篮球联赛

02:15

普瓦捷 86 篮球队

—

埃兰·贝阿奈斯

法国国家篮球联赛B

02:30

布兰普顿蜜獾队

—

尼亚加拉河狮队

加拿大精英篮球联赛

07:30

多伦多 tempo

77:102

亚特兰大梦想队

WNBA

03:00

主队	比分	客队	联赛	时间(北京)
费城费城人队	—	迈阿密马林鱼队	美国职业棒球大联盟	06:40
华盛顿国民队	—	堪萨斯城皇家队	美国职业棒球大联盟	06:45
辛辛那提红人队	—	纽约大都会队	美国职业棒球大联盟	07:10
圣路易斯红雀队	—	圣迭戈教士队	美国职业棒球大联盟	07:45

主队

比分

客队

联赛

时间(北京)

费城费城人队

—

迈阿密马林鱼队

美国职业棒球大联盟

06:40

华盛顿国民队

—

堪萨斯城皇家队

美国职业棒球大联盟

06:45

辛辛那提红人队

—

纽约大都会队

美国职业棒球大联盟

07:10

圣路易斯红雀队

—

圣迭戈教士队

美国职业棒球大联盟

07:45

2026年5月15日赛事报道评论 (23)

如何全面整合赛事信息，为球迷提供最佳观赛体验

GeneBench-Pro 这一新的基准测试，由 OpenAI 发布，旨在评估人工智能模型在生物学计算方面的能力。与传统的侧重于模型是否能够记忆信息或遵循既定步骤完成任务的评估方式不同，GeneBench-Pro 更加注重模型在实际科研场景下的应用价值。它要求模型处理模糊、不完整甚至包含干扰信息的数据，并在此基础上进行判断和分析以得出结论。

该基准测试涵盖了基因组学、定量生物学和转化医学等多个领域，总计包含 129 道题目。这些题目分布在 10 个主要领域和 21 个子领域之下，涉及统计遗传学、群体遗传学、功能基因组学以及蛋白质组学等研究方向。在每一道题目中，模型都会收到一份接近真实科研环境的数据集，附带简要的实验背景说明和一个与后续决策相关的目标问题。模型需要自主完成数据探索，选择合适的分析方法，并在过程中不断调整策略，最终给出答案。

为了规避传统长流程基准测试中常见的评分偏差，OpenAI 在设计 GeneBench-Pro 时采用了合成数据作为核心构建方式。这是因为使用历史真实数据出题时，往往存在多条可行的分析路径，这可能导致模型即使采用了错误的方法，也可能因为偶然性而得到正确答案。

通过使用合成数据，OpenAI 能够完全控制底层的因果关系和数据生成过程，从而更精确地判断模型是否真正理解问题，而不是仅仅走了“捷径”。

目前，OpenAI 已在 Hugging Face 上公开了 10 道代表性的 GeneBench-Pro 示例题，并提供了一个可交互的界面供外部研究人员体验。未来，官方计划将其中 50 道题目提供给 Artificial Analysis 进行独立的第三方评测，以检验不同模型在这一基准测试中的实际表现。这项工作也为人工智能在科学研究领域的应用，例如在世界杯下注等领域提供更精准的预测模型，奠定了基础。

赛事分析师

立即加入世界杯2026FIFA官方网站，体验最激情的足球赛事，感受全球足球盛宴。

官方地址

联系电话

电子邮箱

⚽ 足球实时 (2)

🏀 篮球实时 (6)

⚾ 棒球实时 (4)

如何全面整合赛事信息，为球迷提供最佳观赛体验

专家观点

球迷评论

赛事分析师

热门讨论

资深球迷

足球评论员

数据分析师

发表您的看法

搜索赛事

热门资讯

赛事分类

官方社交媒体

精彩瞬间

⚽ 足球实时 (2)

🏀 篮球实时 (6)

⚾ 棒球实时 (4)

OpenAI 推出 GeneBench-Pro 基准测试，用于评估 AI 模型生物学计算能力 - 世界杯下注

如何全面整合赛事信息，为球迷提供最佳观赛体验

专家观点

球迷评论

赛事分析师

热门讨论

资深球迷

足球评论员

数据分析师

发表您的看法

搜索赛事

热门资讯

赛事分类

官方社交媒体

精彩瞬间