• 简体版 | 繁體版
  • 联系我们
  • 加入我们
  • 关于我们
  •  
  • 首页
  • 快讯
  • 价值号
  • 视频
  • 专题
  • 滚动
  • 入驻价值号
  • 碳链APP
    微信公众号

    扫码下载App

  • 登录
  • 微信公众号

    微信公众号

导航
  • 首页
  • 快讯
  • 区块链+
  • 价值号
  • 视频
  • 专题
  • DeFi优选
碳链价值APP
专注服务于金融科技和区块链
立即打开

纽约大学教授:为什么开源生成式 AI 模型是科学的道德进步之路

Yangz •  2023-04-19
研究人员应该避开专有模型的诱惑,开发透明的大型语言模型,以确保再现性。

撰文:Arthur Spirling 纽约大学政治学和数据科学教授

来源:Nature

图片来源:由无界 AI工具生成

研究人员应该避开专有模型的诱惑,开发透明的大型语言模型,以确保再现性。

似乎每天都有一个新的大型语言模型(LLM)发布,其创造者和学术界都对其响应人类提示的非凡能力感到震惊。它可以修复代码!它可以写推荐信!它能对一篇文章进行总结!

作为一名正在使用和讲授此类模型的政治和数据科学家,从我的角度来看,学者们应该保持警惕。最受追捧的 LLMs 是专有的、封闭的:由公司运营,这些公司不披露其基础模型以供独立检查或验证,因此研究人员和公众不知道该模型是在哪些文件上进行训练的。

急于将这种人工智能(AI)模型用于研究是一个问题。它们的使用威胁着在研究伦理和结果再现性方面来之不易的进展。

相反,研究人员需要合作,开发透明的、不依赖公司偏好的开源 LLM。

诚然,专有模型很方便,可以开箱即用。但是,投资开源 LLMs 势在必行,既要帮助建立开源模型,又要将它们用于研究。我乐观地认为,它们将被广泛采用,就像开源统计软件一样。专有的统计程序最初很受欢迎,但现在我的方法论社区大多使用 R 或 Python 等开源平台。

BLOOM,一个开源的 LLM,于去年 7 月发布。BLOOM 由位于纽约的人工智能公司 Hugging Face 和 1000 多名志愿研究人员建立,部分资金来自法国政府。此外,其他建立开源 LLM 的努力也在进行中。这类项目很棒,但我认为我们需要更多的合作,并汇集国际资源和专业知识。开源 LLMs 通常不像大公司的努力那样有充足的资金。而且,它们需要奔跑着才能站稳脚跟:这个领域的发展如此之快,以至于 LLMs 的版本在几周或几个月内就会变得过时。参与这些努力的学者越多越好。

使用开源的 LLMs 对再现性至关重要。封闭式 LLM 的所有者可以在任何时候改变他们的产品或其训练数据 -- 从而改变其输出。

例如,一个研究小组可能会发表一篇论文,测试一个专有的 LLM 所建议的短语是否能帮助临床医生更有效地与病人沟通。如果另一个小组试图复制这项研究,谁知道模型的基础训练数据是否相同,甚至该技术是否还能得到支持?OpenAI 去年 11 月发布的 GPT-3 已经被 GPT-4 所取代,据推测,支持旧的 LLM 很快将不再是该公司的主要优先事项。

相比之下,有了开源的 LLM,研究人员可以查看模型的核心,了解它是如何工作的,定制其代码并标记错误。这些细节包括模型的可调整参数和它所训练的数据。社区的参与和监督有助于使这些模型长期保持稳定。

在科学研究中使用专有的 LLMs 对研究伦理也有令人不安的影响。用于训练这些模型的文本是未知的:它们可能包括用户在社交媒体平台上的直接信息,或由法律上不同意分享其数据的儿童所写的内容。虽然制作公开文本的人可能已经同意了平台的服务条款,但这也许不是研究人员希望看到的知情同意的标准。

在我看来,科学家应该尽可能在自己的工作中不再使用这些模型。我们应该转而使用开放的 LLM,并帮助其传播。此外,我认为学者们,尤其是那些拥有大量社交媒体粉丝的学者,不应该强迫他人使用专有模型。如果价格飙升,或者公司倒闭,研究人员可能会后悔推广了让同事陷入昂贵合同的技术。

研究人员目前可以求助于私人组织制作的开源 LLM,比如由 Facebook 母公司 Meta 开发的 LLaMA。LLaMA 最初是以个案形式向研究人员发布的,但完整的模型随后被泄露到了网上。例如,我和我的同事们正在使用 Meta 公司的开源 LLM OPT-175 B。LLaMA 和 OPT-175 B 都是免费使用的。从长远来看,不利的一面是,这使得科学依赖于企业的仁慈——这是一种不稳定的局面。

我们应该设立与 LLM 合作的学术行为准则,以及监管。但这些都需要时间,而且根据我作为一个政治科学家的经验,我预计这种规定最初会很笨拙,而且生效缓慢。

与此同时,大规模的合作项目迫切需要支持,以建立用于研究的开源模型 -- 例如欧洲核子研究中心(CERN),国际粒子物理学组织。政府应通过赠款增加资金。该领域正在以闪电般的速度发展,现在需要开始协调国家和国际的努力。科学界最适合评估所得模型的风险,并且在向公众发布这些模型时可能需要谨慎对待。但很明显,开放的环境才是正确的。

展开全文
打开碳链价值APP  查看更多精彩资讯
声明:本文内容为作者独立观点,不代表碳链价值立场,且不构成任何投资理财建议。
0 0
OpenAILLaMAHuggingGPT

扫一扫,分享到微信

相关推荐

ChatGPT一周年,差点吓死OpenAI 滚动

ChatGPT一周年,差点吓死OpenAI

AI之势 2023-11-30 滚动
ChatGPTOpenAI
ChatGPT 今日上线一周年了,OpenAI 却差点没挺过来
Sam Altman回归后首次专访:关于为何被解雇以及神秘的 Q*模型 滚动

Sam Altman回归后首次专访:关于为何被解雇以及神秘的 Q*模型

Kyle 2023-11-30 滚动
OpenAI
Sam 如何看待最近这次公司政变以及 Q* 模型
OpenAI神秘新模型Q*被曝光!据说太过强大可能毁灭人类? 滚动

OpenAI神秘新模型Q*被曝光!据说太过强大可能毁灭人类?

新火种 2023-11-30 滚动
OpenAI大模型Q*
“人工智能是否会对人类构成生存风险”——这个问题始终值得警惕。

碳链快讯更多 ›

2023-11-28

李家超:打击无牌加密平台

2023-11-28

港媒:HOUNAX或为香港本地公司玖币

2023-11-28

Spartan Group管理合伙人:做空头寸信息遭某大型加密交易所泄露

2023-11-28

WSJ:美SEC仍在寻找 Binance.US 存在潜在欺诈的证据

2023-11-28

Vitalik 最新博文阐述对技术乐观主义、AI 风险、区块链和密码学等的看法

2023-11-28

美法官:赵长鹏必须暂时留在美国

2023-11-26

Arthur Hayes:美元流动性增长预示比特币将迎来上行趋势

2023-11-25

Web3 数字银行 iPeakoin 完成近千万美元 A 轮融资,真格基金领投

2023-11-24

盈透证券已获香港零售客户虚拟资产交易的许可

2023-11-23

新加坡拟于2024年中禁止加密货币保证金或杠杆交易,以遏制散户投机

2023-11-22

Mt. Gox 受托人:将很快开始向债权人偿还债务

2023-11-22

Sam Altman 将回归 OpenAI 担任 CEO

2023-11-21

武汉市公安局破获10亿元虚拟币洗钱案

2023-11-20

连线杂志:OpenAI 近 500 名员工威胁辞职,除非董事会辞职并重新任命 Sam Altman

2023-11-20

Tether 自愿冻结与国际犯罪集团有关的 2.25 亿枚被盗 USDT

2023-11-20

OKX已向香港证监会递交虚拟资产交易平台牌照申请

2023-11-20

华尔街日报:Bullish 已收购 CoinDesk 100% 的股权

2023-11-20

彭博:现货比特币 ETF 市场规模有望达 1000 亿美元

2023-11-20

微软 CEO:OpenAI 创始人 Sam Altman 和 Brockman 将加入微软

2023-11-20

Sam Altman回归失败 OpenAI董事会聘请Emmett Shear担任CEO

2023-11-20

彭博社:OpenAI 临时 CEO Mira Murati 计划重新聘请前 CEO Sam Altman 和前总裁 Greg Brockman

2023-11-20

知情人士:在被 OpenAI 罢免前,Altman 正寻求为新的人工智能芯片公司筹集资金

2023-11-19

OpenAI董事会:原则上同意Sam Altman回归

2023-11-19

彭博社:OpenAI 投资者正向公司董事会施压,要求恢复 Sam Altman 的 CEO 职务

2023-11-18

京港互联网 3.0 产业中心暨青年人才基地揭牌

2023-11-18

美 SEC 已推迟对 Global X 与富兰克林邓普顿的现货比特币 ETF 做出决定的日期

2023-11-18

OpenAI 罢免 Sam Altman 的 CEO 与董事会职务

2023-11-18

富达已向美 SEC 提交以太坊现货 ETF 申请

2023-11-17

BitGo 首席执行官:美 SEC 很有可能拒绝一系列现货比特币ETF申请

2023-11-17

日本金融厅批准推出ODX数字证券交易所START

2023-11-17

资产管理公司 WisdomTree 再次提交现货比特币 ETF 的 S-1 招股说明书

2023-11-17

德国联邦议员支持比特币作为该国法定货币

2023-11-16

贝莱德向 SEC 提交以太坊现货 ETF 的 S-1 招股说明书,任命 Coinbase 为托管人

2023-11-16

NYDFS 更新加密货币上市和退市指导方针,要求更为严格

2023-11-16

Arthur Hayes:随着美元流动性上升,比特币等风险资产将继续飙升

2023-11-15

新加坡金管局宣布扩大资产代币化计划

2023-11-15

蚂蚁集团首次披露海外发展数据 营收规模同比增长300%

2023-11-15

马来西亚砂拉越州与蚂蚁数科达成合作 发展数字政务服务应用

2023-11-15

彭博分析师:美 SEC 将在 21 日前对 3 个比特币现货 ETF 申请作出决策

2023-11-15

Cathie Wood:Gary Gensler的政治野心是现货比特币ETF受阻的原因

2023-11-15

Blockchain.com完成1.1亿美元E轮融资,估值较去年3月下跌超50%

2023-11-15

港股上市公司博雅互动拟斥资 9000 万美元购买比特币和以太坊

2023-11-14

加密货币集团 BGX 战略投资 OSL 母公司 BC 科技集团,认购约 7.1 亿港元新股

2023-11-14

渣打银行推出区块链部门 Libeara,拟代币化新加坡元政府债券基金

2023-11-14

韩国金管局成立虚拟资产上币工作组,并开始规划加密货币上市和退市指南

2023-11-14

港股上市公司博雅互动寻求股东授权以在一年内购买至多 1 亿美元加密货币

2023-11-14

BC科技集团出售上海憬威90%股权,并继续短暂停牌以待新股份发行

2023-11-14

传统金融资产代币化公司Fnality完成9500万美元B轮融资,高盛和法国巴黎银行领投

2023-11-13

香港立法会议员邱达根:可将比特币列为金融产品纳入「资本投资者入境计划」资产范围

2023-11-10

香港恒生银行:将与中国建设银行合作探索数字人民币跨境服务

推荐文章

  • 港交所报告解读 | ETF与全球金融市场虚拟资产生态圈的发展

    2023-04-18

  • 苹果MR头显或亮相在即,能否开启”后iPhone时代“?

    2023-04-17

  • 有了插件的ChatGPT,可能会成为未来互联网的唯一入口

    2023-04-17

  • 孟岩:关于香港 Web3 形势的若干观点

    2023-04-17

  • ChatGPT之外,还有这9个AI工具会让你大开眼界

    2023-04-16

价值号更多 ›

达瓴智库
达瓴智库
文章: 156
  • Polkadot:新的机遇与挑战
  • 如何通过MVRV判断加密牛市还是熊市?
  • ETH在上海升级期间表现如何?
区块链骑士
区块链骑士
文章: 1314
  • 开放协议如何提高元宇宙的效率和创新能力?
  • 区块链还潜藏哪些机遇?
  • Web3对传统行业的十大深刻影响
TinTinLand
TinTinLand
文章: 39
  • Web2 巨头进军 Web3 游戏,链游风暴之年已来
  • SFT 半同质化标准创新,实现 DeFi 多元用例
  • Web3 社交的未来已来
换一批

热门标签

新基建 比特币 以太坊 DeFi 共识对话 区块链+ 美联储 央行数字货币 加密衍生品 AI 云计算 大数据 5G 政策 交易所 稳定币 电子支付 Libra 算力产业 联盟链 公链 区块链 加密货币 Nervos Cosmos EOS BCH STO 数字货币 去中心化

邮件订阅

及时、全面、专业、准确的资讯与数据,致力于为区块链爱好者以及数字货币投资者提供最好的服务。

App内打开

邮件订阅

及时、全面、专业、准确的资讯与数据,致力于为区块链爱好者以及数字货币投资者提供最好的服务。

Moshou

碳链价值是集资讯、行情、数据于一身的区块链信息服务平台,我们追求及时、全面、专业、精确的资讯与数据,致力于为区块链创新者和数字货币投资者提供优质的服务。

关于我们 加入我们 联系我们 隐私条款
微信公众号

扫一扫关注微信公众号

Copyright © 2018-2020 碳链价值 京ICP备18046423号
下载碳链App

下载碳链App

微信公众号

微信公众号

微信公众号

微信公众号

打赏文章作者

支付宝打赏二维码 支付宝扫一扫打赏
微信打赏二维码 微信扫一扫打赏

# 热门搜索 #

CBDC 比特币 DeFi 以太坊 区块链