• 0
  • 0
分享
  • ChatGPT爆火背后,生成式AI是否只是“昙花一现”?——软件测试圈
  • 恬恬圈 2023-02-01 08:58:03 字数 3146 阅读 1473 收藏 0

  春节刚过,ChatGPT便快速引爆了资本圈与AI圈,很多从业者把它“吹爆了”。

  OneFlow深度学习框架创始人袁进辉告诉新浪财经,ChatGPT的技术进步,可比作首次“登月”,这样的进步令行业感到震惊。但出门问问创始人兼CEO李志飞虽然也肯定了ChatGPT的变革,但表示“它所知道的答案是缺乏逻辑起点和推理规则,只是一个空中楼阁。“

  为此,新浪财经开通了“chat.openai.com”官网账号上,对ChatGPT进行了实测,看看它究竟有没有那么神奇?能引领AI风口,还是昙花一现?

  实测ChatGPT,究竟有没有那么神奇?

  “ChatGPT的体验已经是目前最好的了,甚至可以当作谷歌来用,有可能会成为未来的信息入口。”这是一位长期行走在美国硅谷的科技观察者,在体验ChatGPT之后对新浪财经发出的感慨。但事实上,从国外到国内,有着类似感慨的人不在少数。

  据在线课程供应商Study.com向1000名18岁以上的学生中发起的一项调查,每10个学生中就有超过9个知道ChatGPT,远远超过小学教育工作者,其中超过89%的学生正在使用ChatGPT来完成家庭作业。

  在新浪财经亲自开通的“chat.openai.com”官网账号上,当作者提出“如何运营一家公司”的问题后,ChatGPT给出的答案不仅简明扼要地给出了运营一家公司必要的流程与步骤,在进一步的深入问答中,也给出了大量具体详细的指引建议。

20-1.png

  “ChatGPT的出现实现了所谓的‘智慧涌现’,这是人类群体智慧的胜利。”这是OneFlow深度学习框架创始人袁进辉在深度测试了ChatGPT之后发出的感慨。在与新浪财经沟通中,袁进辉毫不吝啬地将ChatGPT的技术进步,比作是首次“登月”或者“攀登上珠穆朗玛峰”,直呼这样的进步令行业内的人感到震惊。

  “有点像当时的imagenet时刻,做了几十年搞不动了,突然发现计算机可以解决图像识别了。又或者是张益唐的孪生素数,把边界证明到7000万,虽然数字很大,但这个突破是最大的,改进到几百,甚至个位数是完全可行的。”袁进辉表示。

  袁进辉的感慨,代表了绝大多数AI行业从业者对于ChatGPT的看法。在与新浪科技沟通中,创新工场人工智能工程院执行院长王咏刚、出门问问创始人兼CEO李志飞等人,均先后肯定了ChatGPT对于人工智能行业带来的深刻影响与变革。

  但肯定之外,一些冷静的警醒与反思也同样存在。“AI创作在知识教育领域极度危险,今天的AI生成理论,还没办法保证生成内容的逻辑正确与合理。AI/CS等专业人士要保持冷静,今天的AI仍然没有摆脱大黑盒的问题,跟风要有道德底线。”创新工场王咏刚表示。

  此外,出门问问创始人兼CEO李志飞同样对新浪财经表示,“虽然ChatGPT的聊天技巧已经达到了非常高的水平,逻辑、流畅性都有了,但他所知道的答案却是缺乏逻辑起点和推理规则,只是一个空中楼阁,70%的答案能回答,但对于为何答对了他其实也不知道。”李志飞表示。

  新浪科技实测发现,由于ChatGPT系统获取知识与数据的时间限制,目前ChatGPT所能获取到的数据仅截至2021年,往后新产生的知识以及数据并未被收录,这导致当使用者并不清楚ChatGPT上知识的时间截止线时,往往可能会得到过时的新闻以及知识。此外,由于并不面向中国地区用户开放,ChatGPT在回答对于大多数中国地区公民可能属于常识性的问题时,也往往会回答错误,缺乏准确性。  

20-2.png

  此外,清华大学计算机科学与技术系长聘副教授黄民烈同时还指出,“由于后端的模型和算法设置决定,ChatGPT并没有动态记忆功能。而且目前只是对过往知识的学习和应用,如果没有足够的主题可用信息,很容易用不正确的数据回复。”

  商业化究竟有多难?

  种种问题之下,虽然在一部分投资人以及AI从业者的狂热追捧下,ChatGPT开年之后的第一个工作日便迅速带火了AIGC概念股,使得同花顺人工智能板块涨幅达2.64%,拓尔思、海天瑞声、竞业达、云从科技等上市公司股价纷纷涨停。然而,仍有大量的公司以及个体对ChatGPT果断地说出了“NO”。

  就在ChatGPT推出不久后,知名的程序员问答网站Stack Overflow宣布禁止将ChatGPT所产生的问题用于回答社区问题,并且开出了违规者最多可被封禁30 天的惩戒措施。此外,来自纽约大学等高校的教授以及诸多学者们也纷纷发出警告称,“AI会让学生大脑萎缩,要像避瘟神一样躲开ChatGPT!”

  争议之下,ChatGPT的商业化问题成为了值得关注的焦点。在李志飞看来,“ChatGPT的出现,为AI行业带来了一种新的商业模式可能性。此前,AI企业的收费模式更多的是To B收费制,可复制性差,缺乏网络规模效应,边际成本不可控。但ChatGPT的出现,让人们看到了AI技术赋能C消费者的可能性,通过给中小企业或个人提供AI工具或服务,也可能获得认可并取得收益。”

  “ChatGPT提供了新的视角。在一个强大的基座模型基础上,辅以高质量、多样性的数据,用强化学习方法能做到非常好的效果。这里面,数据和模型之间的闭环得以形成,这是每个AI企业值得去思考的事情。未来除了通用的任务助理,开放域闲聊也会成为人机交互的主要形式。一个满足信息需求,一个满足社交和情感需要。”黄民烈对新浪财经表示。

  不过作为一项“现象级”的技术创新,ChatGPT的大规模商业应用,脱离不了算力的支撑。据悉,目前ChatGPT一次模型底座的训练需要500万美元的算力成本,一次问答的综合成本在0.8美元。据小冰公司CEO李笛此前预算,“如果小冰用ChatGPT的方式来运行系统,现在小冰每天承载的交互量就需要花近3亿人民币的对话成本,即使ChatGPT可以把成本优化到现在的10%,也赚不回来。”

  “因为人工智能最大的特点就是高并发。如果成本是这样,不如雇人。”李迪表示。在他看来,ChatGPT贵是因为它追求极致交互的效果,用了最复杂的方法来实现它。“虽然大家现在不停地在寻找各种等价替换的方法,成本会不断地逐渐地降低,但它目前为止更多地是一个研究方面上的突破,是一个实验室上面的突破。”

  据彭博社、花旗集团近日估计,ChatGPT可能会在未来12个月内为英伟达带来30亿至110亿美元的销售额。ChatGPT爆火了,但最先从中盈利的却是更加底层的算力公司。 

  昙花一现?

  虽然ChatGPT的走红同样伴随着批判与争议,但乐观的声音仍然认为,ChatGPT的出现将进一步推动对话AI以及生成式AI的进一步发展。

  在1月11日达摩院在其发布的2023十大科技趋势中预测,生成式AI将迎来应用大爆发,极大推动数字化内容的生产与创造。此外,数据分析服务提供商PitchBook提供的数据显示,2022年(数据截至2022年12月6日),生成式AI领域的风险投资达21亿美元,融资事件超过100起。在2020年至2022年间,该领域的风险投资增长了425%。

  “我觉得ChatGPT不会是昙花一现的,他将会是各样在线顾问、陪聊天等职业自动或半自动化的一个非常重要的里程碑,甚至于可以说是一个必经的节点。”李志飞对新浪财经表示。在他看来,“虽然当前ChatGPT仍存在着一些缺陷,但是接下来一定会有特别多的人和公司会进入,把他的垂直化商业化做好。”

  从历史的规律来看,每一项技术的实现都是在饱受争议与诟病中前行。虽然那些批判的声音往往意味着当下的正确,但大多数被批判者往往在接受批判之后不断迭代前行,并最终赢回失去的尊严。


作者:佚名

原文链接:新浪科技_新浪网(sina.com.cn)

  • 【留下美好印记】
    赞赏支持
登录 后发表评论
+ 关注

热门文章

    最新讲堂

      • 推荐阅读
      • 换一换
          • 1.概述软件测试是指在规定的条件下对程序进行操作,以发现程序错误,衡量软件质量,并对其是否能满足设计要求进行评估的过程。测试案例作为测试执行的依据在软件测试工程中发挥着重要的作用。本文从测试案例的设计意义出发,剖析了测试案例的设计策略、原则和分类,帮助测试人员在进行测试案例设计时,找到案例的设计方向和方法。2.什么是测试案例设计测试案例的设计简单说的就是设计一个测试场景,通过这个测试场景中的输入、执行条件和输出,来判断应用系统是否存在系统缺陷和不足;即通过执行测试案例,来判断系统是否能够正常运行并且达到程序所设计的执行结果。根据测试案例的性质划分,测试案例在设计上可以分为正向测试案例和反向测试...
            0 3 8894
            分享
          • 大体上,我们可以从支付流程、退款流程、非功能测试点及支付测试的方法四个方向考虑。一、支付流程支付的测试流程:点击支付-->选择支付方式-->确认金额-->输入密码-->成功支付。需要针对支付流程中的每个阶段和步骤分别测试。1、支付:点击支付,然后取消订单,能否正常取消。2、选择支付方式:可以从正常和异常角度考虑。正常:可以支持的支付方式有:信用卡,储蓄卡,网银支付,余额,第三方支付(微信,支付宝,京东、百度、聚合支付、组合支付),找人代付,验证是否支持并且可以正常选择并支付;异常:支付时结合优惠券/折扣券/促销价抵扣进行相关的抵扣,验证规则正确,并且可以正常抵扣和支付。...
            3 3 15287
            分享
          • 软件测试概述程序+文档+数据=软件。狭义的软件测试定义:为发现软件缺陷而执行程序或系统的过程。广义的软件测试定义:人工或自动地运行或测定某系统的过程,目的在于检验它是否满足规定的需求或弄清预期结果和实际结果间的差别,为什么要做软件测试。发现软件缺陷功能错功能遗漏超出需求部分(画蛇添足)性能不符合要求软件质量高低:是否符合用户习惯、符合用户需求测试的任务找出定位修改修改后要做回归测试,对已修改的部分进行再次的测试,避免引入新的错误测试用例的定义和组成部分测试用例是为特定的目的而设计的一组测试输入、执行条件和预期的结果。测试用例是执行的最小实体。简单地说,测试用例就是设计一个场景,使软件程序在这种...
            13 13 1666
            分享
          •   1、前言  大家好!我是Meng  前段时间,很荣幸被一合作伙伴邀请发表一篇文章,主题为"这些年,我所从事软件测试的一些感悟",正好趁着这个机会,我也好好总结一下。  2、测试培训  对于软件测试,在培训之前也不知道是干什么的,只知道有软件开发,之后才知道有软件测试这个行业。  刚开始也是在徘徊是做开发还是做测试,经过多次被测试机构的招生老师洗脑后,开始进行了软件测试培训之旅。那时候测试培训机构就那么几家,基本都是机构,个人的很少,培训机构是线下的,线上的也很少。培训价格方面也是过万了,跟现在的培训机构差不多,也就便宜了几千而已。  回头一想想,那时候教的内容,真的很少...
            0 0 1337
            分享
          •   测试用例编写完之后,我们在测试过程中往往会发现,有一些用例其实是重复的,造成很多重复工作,那么我们应当如何去除这些重复用例呢?  尤其使用等价类划分和边界值分析编写用例时,很容易造成用例重复。  举例  下面我们通过一个例子来具体分析一下。  首先选择一个场景,后台维护前台账号,主要有以下几个字段(字段太多,这里只列举三个字段进行分析)。  账号:4~8位字母和数字组合  密码:8~16位字母数字组合  姓名:字母、数字、特殊字符和汉字组合,长度4~20  下面我们对他们的等价类和边界值进行分析。  账号  有效等价类:6位数字和字母组合,5位纯数字组合,7位纯字母组合。  无效等价类:3...
            0 0 929
            分享
      • 51testing软件测试圈微信