• 简体版 | 繁體版
  • 联系我们
  • 加入我们
  • 关于我们
  •  
  • 首页
  • 快讯
  • 价值号
  • 视频
  • 专题
  • 深度
  • 入驻价值号
  • 碳链APP
    微信公众号

    扫码下载App

  • 登录
  • 微信公众号

    微信公众号

导航
  • 首页
  • 快讯
  • 区块链+
  • 价值号
  • 视频
  • 专题
  • DeFi优选
碳链价值APP
专注服务于金融科技和区块链
立即打开

他做了一个「ChatGPT 杀手」,a16z 抢着投

极客公园极客公园  •  2023-01-18
「GPTZero」在网络迅速爆红,吸引了 a16z 在内的硅谷创投的目光

作者 | 美漪

最近两个月,科技圈最热的话题,无疑是 OpenAI 推出的对话式 AI 应用 ChatGPT,不仅可以让它给你写一首诗、回答你的任何问题,甚至可以让它帮忙写没那么复杂的代码。业内甚至认为,ChatGPT 甚至有取代谷歌的潜力。

为 ChatGPT 欢呼的还有另一群人,就是「社畜」和学生——他们发现月度总结、学校论文和作业这样的任务,也可以让 ChatGPT 代劳了,后者甚至写得有模有样,不比真人写得差多少。

ChatGPT 似乎让学生们的日子更轻松了,但却让教师更「头疼」了,因为后者很难确认,眼前这些文字,到底是学生写的,还是出自 OpenAI 的产品之手。为此,纽约教育部甚至禁止公立学校使用 ChatGPT。

在这样的混乱中,一位普林斯顿大学的学生,Edward Tian 推出了一个专杀 ChatGPT 的应用——「GPTZero」,有了这面「照妖镜」,内容是人写的,还是机器写的,真相马上就揭晓。

「GPTZero」在网络迅速爆红,吸引了 a16z 在内的硅谷创投的目光。但是应用创造者本人 Tian 却认为,最重要的事,是「让 AI 更加透明」。

01「ChatGPT 杀手」

在 ChatGPT 成为学生们「偷懒」的神器后,教育和科研机构不得不开始抵制这个新的噩梦。

纽约教育部宣布禁止学生在公立学校使用 ChatGPT ;全球知名机器学习会议之一的 ICML 也宣布禁止发表包含由 ChatGPT 和其他类似系统生成内容的论文,以免出现「意外后果」。

出于对学术界,使用 ChatGPT 相关道德问题的担忧,华人小哥 Edward Tian 在一家当地的咖啡店里,花了一个寒假的时间,研发了 GPTZero,希望能让学术界恢复严谨性。

Tian 年仅 22 岁,目前仍是美国普林斯顿大学的大四学生,主修计算机科学专业,专门研究自然语言处理,同时辅修认知科学和新闻学。

GPTZero 的开发者 Edward Tian|网络GPTZero 的开发者 Edward Tian|网络

他还曾是英国广播公司和开源情报网站 Bellingcat 的研究员,也曾是被微软收购的反恐初创公司 Miburo Solutions 的分析师。在那里,他监测虚假信息和机器人检测。Tian 说,「所有的这些经历,都是他研发 GPTZero 的动力」。

2023 年 1 月 2 日,Tian 将 GPTZero 发布到网络,预计只会有几十个人尝试它,完全没有想过,这会掀起一场世界级别的轩然大波。

在他把这款软件上传到互联网上的几个小时内,竟有超过 2000 人在 Steamlit 上测试了 GPTZero 的公开版本。

1 月 5 日,也就是发布的第三天,Tian 对 GPTZero 做出了更新和改善,还显著降低了误报率;此时,新程序已有超过 1 万的用户量了!Tian 也不禁对它的「爆炸性增长」和「病毒式传播」感到震惊。

据 NPR 报道,一周内有 3 万多人试用了 GPTZero,甚至「导致该应用由于出乎意料的高网络流量」而崩溃,托管 GPTZero 的免费平台 Streamlit 此后介入,以更多的内存和资源支持 Tian,以处理网络流量。

Edward Tian 通过在视频中展示其对一篇《纽约客》文章和 LinkedIn 上的 ChatGPT 生成器的帖子的分析,展示了该应用如何区分人类和人工智能撰写的文本。

GPT Zero 的工作原理就是检测文本的「困惑性」(Perplexity)和「突发性」(Burstiness)这两项指标,并分别对其打分,根据统计学特征来确定,文本是由人工智能写的还是人类写的。总体来说,如果这两项参数得分都很低,那么该文本很有可能出自 AI 之手。

这里所说的「困惑性」,是指来自人类所写作品的语言的复杂性和随机性。

这个指标主要是衡量文本在一个句子中的随机程度,以及一个句子的构造方式是否会让 GPTZero 感到困惑。

每当用户在 GPTZero 输入一段测试内容,它就会分别计算出:「文字总困惑度」、「所有句子的平均困惑度」、「每个句子的困惑度」。

这些数值越低,越能说明这个文本对 GPTZero 来说是非常「熟悉」的,那么它很可能是 AI 生成的;相反,如果这些数值越高,就越能说明文本中句子的构造或用词方式让 GPTZero 感到「惊讶」,那么它就更可能是出自人类之手。

这是因为,人工智能接受过数据库的训练,生成的文本在一段时间内,表现出的困惑度会更均匀和恒定,选词的可预测性也更高;而人类书写的文本则不会这样,真人的遣词造句一般会比较随机,比机器更容易写比较出乎意料的词句。

使用 GPTZero 检测文字是否由 ChatGPT 生成|Twitter使用 GPTZero 检测文字是否由 ChatGPT 生成|Twitter

而「突发性」,则是指来自人类使用的句子结构的变化。

这个参数主要是比较句子复杂性的变化程度,衡量它们的一致性。

这是因为,人类倾向于写高度复杂的文本;而人工智能产出的文本则是低复杂度的;此外,由于人类的思维结构不是线性的,他们的句子结构也遵循类似的模式。

这意味着,人类使用句子结构,会在长而复杂的句子,和短而简单的句子之间摇摆不定,有着更多的句式变化,比如复杂和简单交替并存,一个长难句之后接着出现更简短的句子;而机器生成的句子则倾向于更加统一,很少会有一系列长度相差很大的句子。

简而言之,在选词上「简单」而「熟悉」,并使用「统一整齐」的句子,是人工智能生成作品的标志特征,而更复杂和多样的东西,则表明是人类写的。这也是「困惑性」和「突发性」这两项指标可以作为衡量标准的原因。

除了 Edward Tian 本人对 GPTZero 进行测试之外,也有不少网友用它对 ChatGPT、一些 GPT-3 衍生工具生成的内容进行了多次测试。最终结果显示,GPTZero 每次都能抓住 AI 生成的文本,并在十多个案例中正确识别了人类写的文本。

GPTZero 的一炮而红,让 Tian 获得了来自 a16z、 Menlo Ventures 和 Red Swan 等知名风投的青睐。不过,面对推特私信和电话轰炸,Tian 却显得异常冷静,他谦逊地表示自己不会拒接投资者打来的电话,但他不会忘记自己仍然是一位即将毕业的大四学生。

同时,他还表示自己的 GPTZero 尚未完成,仍需改进和进一步地开发,甚至计划让大家继续免费使用他的程序,用来支持各地新晋英文老师的工作。

02急需的「AI 透明」

对于 GPTZero 这一甄别文字是否是 AI 写作的新程序,推特上的舆论褒贬不一,以教师为代表的成年人大多喜闻乐见,而学生却讽刺 GPTZero 的创造者 Tian 是「学术缉毒警察」。

的确,当 GPTZero 推出时,Tian 收到了众多教师对该应用程序在检测 AI 写的文章方面的积极反馈,来自世界各地的无数教师也都对 Tian 表达了他们的感激之情——这让他们的教学难度大大减轻了。

当然,也不难理解,不少学生并不看好 Tian 这款打击学术偷工减料、不劳而获的软件。

事实上,不只是 Tian,就连 ChatGPT 的开发商 OpenAI 自己,也已经表明了对防止人工智能剽窃的承诺。

2022 年 12 月,OpenAI 专注于人工智能安全的研究员 Scott Aaronson 透露,该公司正在努力开发「缓解措施」,用一种「不易察觉的秘密信号」对 GPT 生成的文本打上「水印」,以识别其来源,从而打击作弊的系统。

这项技术将通过微妙地调整 ChatGPT 选择的特定单词选择来发挥作用,读者不会注意到这种方式,但对于任何寻找机器生成文本迹象的人来说,这在统计上都是可预测的。

公司发言人表示,「我们将 ChatGPT 作为新研究的预览技术,希望能从现实世界的应用中进行学习。我们认为这是开发和部署功能强大、安全的 AI 系统的关键部分。我们会不断吸取反馈和经验教训,」。

GPTZero 首页|GPTZeroGPTZero 首页|GPTZero

此外,OpenAI 还联合哈佛等高校机构联合打造了一款检测器:GPT-2 Output Detector。

作者们先是发布了一个「GPT-2 生成内容」和 WebText 数据集,帮助 AI 理解机器语言和人类语言之间的差异。

随后,用这个数据集对 RoBERTa 模型进行微调,就得到了这个 AI 检测器。其中人类语言一律被识别为 True,AI 生成的内容则一律被识别为 Fake。

值得一提的是,RoBERTa 是 BERT 的改进版。原始的 BERT 使用了 13GB 大小的数据集,但 RoBERTa 使用了包含 6300 万条英文新闻的 160GB 数据集。

尽管如此,还是有不少人认为,「AI 文本检测器」注定是一场失败的「军备竞赛」,其实际效果并不理想,更无法阻挡 ChatGPT 等 AI 语言模型的发展。

然而,尽管 Tian 建立了 GPTZero,他并不反对使用 ChatGPT 等人工智能工具,他认为 GPTZero 应用程序的目的不是阻止这些新技术的使用,而是提供一种负责任地使用这些技术的方法,并提供必要的保护。

同时,相对于对抗或者禁止一项技术,也许更重要的是如何为其使用定下规范和标准。例如,在广告、影视及娱乐等行业,对于 AI 生成类内容的容忍度可能适当提高一些;而在学术、教育和科研领域,非常强调准确性和原创性,毫无疑问,对于 AI 生成内容的容忍度就要低一些。

而如何确定 AI 工具使用的「透明度」,可能要比研究如何「反 AI」,要更有效,也更有意义一些。

展开全文
打开碳链价值APP  查看更多精彩资讯
声明:本文内容为作者独立观点,不代表碳链价值立场,且不构成任何投资理财建议。
0 0
AIGCChatGPT

扫一扫,分享到微信

相关推荐

深度解密 AIGC 的发展与现状 深度

深度解密 AIGC 的发展与现状

Daorayaki 2023-01-19 深度
AIGC
AIGC是Web3.0时代的生产力工具,AIGC提供大量的生产力,而Web3.0与区块链的应用则决定生产关系与用户主权。
微软下个十年的想象力,藏在ChatGPT里 滚动

微软下个十年的想象力,藏在ChatGPT里

AI之势 2023-01-18 滚动
AIGC
押注AI再放大招,微软要把ChatGPT嵌入旗下全家桶。
拥抱人工智能!微软将在Azure云服务中加入AI机器人ChatGPT 滚动

拥抱人工智能!微软将在Azure云服务中加入AI机器人ChatGPT

AI之势 2023-01-17 滚动
AIGCChatGPT
微软计划加大对OpenAI的投资

碳链快讯更多 ›

2023-01-27

美 SEC 再度拒绝 Ark Invest 和 21Shares 的现货比特币 ETF 上市申请

2023-01-27

美众议院数字资产小组委员会主席:稳定币立法为今年主要任务

2023-01-27

彭博社:穆迪正在开发稳定币评分系统

2023-01-26

Aave 将购买 270 万枚 CRV 以弥补 Aave V2 超额债务

2023-01-26

Coinbase 被荷兰央行处以 363 万美元行政罚款,因其曾在未注册时提供加密服务

2023-01-26

路透社:币安为涉嫌非法资金案的 Bitzlato 处理了近 3.46 亿美元资金

2023-01-26

Web3 开发平台 Bunzz 完成 450 万美元种子轮融资

2023-01-26

FTX 披露机构债权人完整名单,包括 Apple、Netflix 和 Coinbase 等公司

2023-01-26

特斯拉在 2022 年第四季度没有交易任何比特币

2023-01-25

元宇宙电商 Emperia 完成 1000 万美元 A 轮融资,索尼创新基金等参投

2023-01-25

链游工作室 Mythical Games 拟筹集 5000 万美元新一轮融资

2023-01-25

A16z 领投游戏工作室 Voldex 的 A 轮融资

2023-01-25

法国参议员投票放宽加密许可监管

2023-01-25

Blockstream 完成 1.25 亿美元的可转换票据和担保贷款融资

2023-01-24

美 SEC 专员:SEC 不会单方面拒绝加密公司注册,但需要「比正常情况下更长的时间」

2023-01-24

QuickNode 以 8 亿美元估值完成 6000 万美元 B 轮融资

2023-01-24

欧洲央行执委:数字欧元隐私决定权将留给欧盟立法者

2023-01-24

法国国民议会将于周二就加密公司强制性许可制度进行投票

2023-01-24

MakerDAO 批准在 Yearn Finance 部署 1 亿美元 USDC

2023-01-24

Pantera Capital:2023 年将是区块链创业的绝佳时机

2023-01-24

Gemini 计划进行第三轮裁员,规模为 10%

2023-01-24

Genesis:希望在本周末之前与债权人达成协议,考虑出售自己来偿还债务

2023-01-23

慢雾:疑似朝鲜黑客组织「Lazarus Group」已将部分 Harmony 被盗资金转移到 ETH/Tron 链混币网络

2023-01-23

V神撰文介绍「隐身地址」概念以解决以太坊隐私保护难题

2023-01-23

数据:2022 年前 20 大对冲基金收益达 224 亿美元,Citadel 收益 160 亿美元创新高

2023-01-23

韩国法院裁定 NFT 属投机行为,不受现行立法保护

2023-01-22

在以太坊上部署 Aave V3 的提案已发布,将于一天内开始投票

2023-01-22

俄罗斯金融情报部门将斥资 3.4 亿卢布改进加密货币追踪系统

2023-01-22

美国联邦住房贷款银行向 Signature Bank 和 Silvergate 共提供超 130 亿美元贷款

2023-01-22

Circle 首席执行官:Circle 将推出跨链传输协议

2023-01-21

CNBC:联邦检察官没收 SBF 价值约 7 亿美元资产

2023-01-21

元宇宙电商公司 The Edit LDN 完成 480 万美元种子轮融资,Regah Ventures 领投

2023-01-20

Genesis提交第11章破产申请文件

2023-01-20

彭博社:Cardano 联合创始人考虑收购 CoinDesk,可以负担 2 亿美元售价

2023-01-20

Web3 社交平台 Plai Labs 完成 3200 万美元种子轮融资,a16z 领投

2023-01-20

加密借贷平台 Nexo 已与美 SEC 达成和解,将支付 4500 万美元罚款

2023-01-20

FTX 新任 CEO:已成立工作组探讨重启 FTX.com 事宜

2023-01-19

ZK技术开发商Nil完成2200万美元融资,Polychain Capital领投

2023-01-19

Peter Thiel 旗下基金已于去年 3 月出售大部分加密资产,回报额达 18 亿美元

2023-01-19

​韩国釜山市将在今年推出以区块链为基础的分权型数字商品交易所

2023-01-19

Circle和Uniswap联合研究:DeFi可解决外汇交易风险问题,每年可节省300亿美元跨境汇款成本

2023-01-19

元宇宙游戏 Neopets Metaverse 完成 400 万美元融资,Polygon Ventures 等参投

2023-01-19

美CFTC专员:客户资金应与公司资产分离,建议成立行业自律组织

2023-01-19

美司法部:加密交易所 Bitzlato 是俄罗斯非法金融的主要洗钱方

2023-01-19

Ripple CEO:与美 SEC 的法律纠纷或将在今年上半年解决

2023-01-19

MakerDAO 正通过投票调整 GUSD 作为抵押品的参数,以限制 DAI 对 Gemini 的敞口

2023-01-19

韩国将允许发行证券型代币,下月初公布 STO 发行和流通方针

2023-01-19

Linux 基金会成立开放元宇宙基金会,将协调开发元宇宙开源软件和标准

2023-01-19

ConsenSys 确认将裁员 97 人,占员工总数 11%

2023-01-19

Coinbase 将上线 Kava(KAVA)

推荐文章

  • 华尔街日报:DCG 创始人如何摆脱困境?

    2023-01-18

  • 争抢元宇宙:各地规划元宇宙产业规模总计8500亿

    2023-01-18

  • 普华永道:消费品企业如何在「后疫情时代」拥抱元宇宙?

    2023-01-17

  • 元宇宙为何会对工业产生影响?

    2023-01-17

  • 俄罗斯和伊朗将联手发行与黄金挂钩的稳定币

    2023-01-17

价值号更多 ›

吉时通信
吉时通信
文章: 140
  • 释放ChatGPT3的力量:如何用AIGC撰写研报?
  • 科普:关于AIGC的十问十答
  • 从DNS到ENS:域名的Web3时代
链集市ChainMarket
链集市ChainMarket
文章: 223
  • 区块链产业周报|工信部公示2022区块链典型应用案例名单;吉利成立区块链公司;亚马逊云提供区块链解决方案
  • 航运迎来大变革:区块链在其中扮演怎样的角色?
  • 区块链产业周报|麦肯锡推出元宇宙报告,2030年元宇宙将有高达5亿美元价值;香港提出CBDC新思路
Unitimes
Unitimes
文章: 403
  • 以太坊 MEV 黑暗森林:从 Gas 战争到 PBS
  • 对话 Vitalik:合并后 以太坊的下一步是什么?
  • 为什么以太坊是最好的选择?
换一批

热门标签

新基建 比特币 以太坊 矿业 DeFi 共识对话 区块链+ 研报 美联储 央行数字货币 无限QE 加密衍生品 AI 云计算 大数据 5G 政策 交易所 稳定币 电子支付 Libra 算力产业 联盟链 公链 区块链 加密货币 Nervos Cosmos EOS STO

邮件订阅

及时、全面、专业、准确的资讯与数据,致力于为区块链爱好者以及数字货币投资者提供最好的服务。

App内打开

邮件订阅

及时、全面、专业、准确的资讯与数据,致力于为区块链爱好者以及数字货币投资者提供最好的服务。

Moshou

碳链价值是集资讯、行情、数据于一身的区块链信息服务平台,我们追求及时、全面、专业、精确的资讯与数据,致力于为区块链创新者和数字货币投资者提供优质的服务。

关于我们 加入我们 联系我们 隐私条款
微信公众号

扫一扫关注微信公众号

Copyright © 2018-2020 碳链价值 京ICP备18046423号
下载碳链App

下载碳链App

微信公众号

微信公众号

微信公众号

微信公众号

打赏文章作者

支付宝打赏二维码 支付宝扫一扫打赏
微信打赏二维码 微信扫一扫打赏

# 热门搜索 #

CBDC 比特币 DeFi 以太坊 区块链