当前位置：网站首页 >> 网络游戏 > >> 正文

工联院大模型测评：文心一言在工业领域表现超过GPT3.5-新动态

时间：2023-06-29 20:43:58

近期，中国工业互联网研究院（简称“工联院”）针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示，百度文心一言表现超过GPT3.5，综合评价指数在国内排名第一。

(相关资料图)

工联院本次评测选取了工业领域典型的八大行业。百度文心一言在电子设备、装备、钢铁、采矿、电力、石化、建材等七大行业均获国内第一。

据悉，评测对象涵盖GPT4、GPT3.5、文心一言、ChatGLM等国内外具有代表性的头部大模型。评估结果选取性能前六名的模型进行公布。

百度文心一言测评表现超过GPT3.5

本次工业知识问答测试主要分为客观题与主观题两大类，总计超过1100个问题。主观题主要考察四大维度：基础能力、语句能力、概括能力和逻辑能力。

评测结果显示，GPT4表现最佳。国内头部大模型表现亮眼，整体与GPT3.5相当。其中百度文心一言表现超过GPT3.5，在国内大模型中排名第一。

在客观题环节，评测结果显示，GPT4与文心一言表现好于其他大模型。但评测结果也同时指出，大模型普遍准确率有较大的提升空间。

主观题方面，国内大模型的基础能力、语句能力与GPT4接近，概括能力、逻辑能力与GPT4有一定差距。

在大模型的自我认知能力和污染问题分析能力上，GPT4相较于其他大模型表现出更好的能力。

大模型发展新热点：丰富特定行业专业知识

虽然国内大模型在本次评测表现较好，甚至在部分行业赶超GPT3.5，但工联院评测报告也指出，国内外通用大模型在工业知识问答领域探索仍处于初级阶段，国内大模型与GPT4有差距，比如行业间的泛化能力有待加强。

实际上，工联院评测报告揭示出通用大模型落地垂直行业的痛点，缺乏特定行业的专业知识。

关于解决难题的方法，工联院评测报告给出的建议是，进一步丰富相关专业领域的数据训练集，进一步进行专业化的微调。

当前，国内科技公司纷纷加强与工业企业合作，期望通过在实际场景中探索应用大模型，弥补差距，赶超GPT4.0。

比如百度文心一言与南方电网电力调度控制中心在电力调度场景探索使用调度AI大模型。在汽车行业，长安汽车基于百度文心大模型正在开发生成式人工智能产品，赋能一款量产车型，实现提升用户体验的目标。除了能源、汽车制造，百度智能云还在建筑、采矿、物流、纺织等领域，探索使用大模型提升运营效率和用户体验效果。

据悉，未来，工联院将持续开展通用大模型在工业领域更多维度的性能评测，包括但不限于大模型的鲁棒性、安全性以及人类大价值观等。（肖智）

关键词：

上一篇: 服务外推探索家庭医生新职能丨重读基层⑧_全球热消息 下一篇: 最后一页

精彩推荐

x 广告

独立游戏

全国楼市再现下跌势头业内专家预测广州楼市复苏时间

2022-06-20

江苏常州湖塘花园街发生爆炸 3人送医救治3人被困

2022-05-25

保护珠江水域生态大藤峡水利枢纽水生态保护体系基本建成

2022-05-25

角色扮演

25

2022-05

谨防饥饿营销引发食品浪费

25

2022-05

影响出行屡遭吐槽共享单车何以成“牛皮癣”新宿主

25

2022-05

常州武进居民楼爆炸导致房屋坍塌 5人受伤1人死亡

25

2022-05

肯德基可达鸭为何“一鸭难求”？

25

2022-05

“女博士报考协警”反转，“唯名校病”得好好治

动作游戏

x 广告

工联院大模型测评：文心一言在工业领域表现超过GPT3.5-新动态

精彩推荐

工联院大模型测评：文心一言在工业领域表现超过GPT3.5-新动态

服务外推探索家庭医生新职能丨重读基层⑧_全球热消息

酒驾放出来了还会拘留吗_今日热闻

【当前热闻】中国—中南半岛20多个重点陆路口岸联合倡议跨境物流口岸智慧互联合作

世界时讯：恒盛能源(605580)龙虎榜数据(06-29)

宝鼎科技：控股股东协议转让股份事项获烟台市国资委批复

独立游戏

全国楼市再现下跌势头业内专家预测广州楼市复苏时间

江苏常州湖塘花园街发生爆炸 3人送医救治3人被困

保护珠江水域生态大藤峡水利枢纽水生态保护体系基本建成

角色扮演

25

谨防饥饿营销引发食品浪费

25

影响出行屡遭吐槽共享单车何以成“牛皮癣”新宿主

25

常州武进居民楼爆炸导致房屋坍塌 5人受伤1人死亡

25

肯德基可达鸭为何“一鸭难求”？

25

“女博士报考协警”反转，“唯名校病”得好好治

动作游戏

擅自使用有影响力企业标识误导消费者上海一企业涉嫌违法被立案调查

降雨导致G0422武深高速湖南段发生山体滑坡目前正在抢修中

上海：核酸采样医废不得露天堆放在街边，请市民监督

老人无法扫场所码？上海金山公交车配手持式设备刷身份证

上海金山部分景区今试点开放，把好入口关管理关应急关

工联院大模型测评：文心一言在工业领域表现超过GPT3.5-新动态

精彩推荐

工联院大模型测评：文心一言在工业领域表现超过GPT3.5-新动态

服务外推 探索家庭医生新职能丨重读基层⑧_全球热消息

酒驾放出来了还会拘留吗_今日热闻

【当前热闻】中国—中南半岛20多个重点陆路口岸联合倡议 跨境物流口岸智慧互联合作

世界时讯：恒盛能源(605580)龙虎榜数据(06-29)

宝鼎科技：控股股东协议转让股份事项获烟台市国资委批复

独立游戏

全国楼市再现下跌势头 业内专家预测广州楼市复苏时间

江苏常州湖塘花园街发生爆炸 3人送医救治3人被困

保护珠江水域生态 大藤峡水利枢纽水生态保护体系基本建成

角色扮演

25

谨防饥饿营销引发食品浪费

25

影响出行屡遭吐槽 共享单车何以成“牛皮癣”新宿主

25

常州武进居民楼爆炸导致房屋坍塌 5人受伤1人死亡

25

肯德基可达鸭为何“一鸭难求”？

25

“女博士报考协警”反转，“唯名校病”得好好治

动作游戏

擅自使用有影响力企业标识误导消费者 上海一企业涉嫌违法被立案调查

降雨导致G0422武深高速湖南段发生山体滑坡 目前正在抢修中

上海：核酸采样医废不得露天堆放在街边，请市民监督

老人无法扫场所码？上海金山公交车配手持式设备刷身份证

上海金山部分景区今试点开放，把好入口关管理关应急关

服务外推探索家庭医生新职能丨重读基层⑧_全球热消息

【当前热闻】中国—中南半岛20多个重点陆路口岸联合倡议跨境物流口岸智慧互联合作

全国楼市再现下跌势头业内专家预测广州楼市复苏时间

保护珠江水域生态大藤峡水利枢纽水生态保护体系基本建成

影响出行屡遭吐槽共享单车何以成“牛皮癣”新宿主

擅自使用有影响力企业标识误导消费者上海一企业涉嫌违法被立案调查

降雨导致G0422武深高速湖南段发生山体滑坡目前正在抢修中