海龟汤的有趣在于提问者脑洞大开,有时会问出一些不可思议的问题,引起爆笑;有时会突然问到关键的问题,令人细思极恐。
通过一系列的问答,玩家需要根据出题人的回答组织信息,获取线索,还原事件过程。 问题个数不受限制,这个过程就是考验脑洞的时刻啦!
而且海龟汤大多是猎奇恐怖的故事,在提问过程中会不自觉想象故事中的场景,体验感十足。
为了让大家更好的体会到海龟汤的乐趣,丝丝为大家奉上——海龟汤保姆级入门指南!
什么是海龟汤?海龟汤是一个情景推理游戏,由出题人给出一个简短且缺少许多细节的汤面,通常只一句带过故事过程,直接呈现故事结果。
玩家通过问问题来猜出汤底即故事的来龙去脉,出题人只能对问题回答是或不是,是一个层层抽丝还原故事的过程
玩法有一个出题者(煲汤人)向玩家讲述一个非常模糊的故事片段(汤面)。
玩家需要通过不断向出题者提问(喝汤),一步步推理出故事的真相(汤底)。
在这个过程中,出题者只能回答是、不是、是也不是或不重要。 在某些关键问题处,出题者可以给出额外的信息提示。
攻略1. 系统的发问有助于高效拉出故事的框架,一般按【时地人事】来提问会更加有效
2. 海龟汤多人参与会更加出效果,一起开发脑洞、碰撞思维效率更高
3. 海龟汤里的故事与现实相差较远,不用过度思考故事的合理性,享受一层层揭开迷雾的过程就好了。
#烧脑 #恐怖 #悬疑 #推理游戏 #解密 #海龟汤 #聚会游戏
出品|三言Pro
日前,三六零集团创始人周鸿祎在第七届世界智能大会上展示了两款大模型产品,“360智脑”以及AI生图工具“360鸿图”。
其中,“360智脑”接入了智能搜索场景,在展示环节回答问题时内容详实、条理清晰。而“360 鸿图”,画出了一张2025年天津滨海新区的图景。
会后,周鸿祎在社交平台发文表示,这两个产品在认知、逻辑、推理能力上都有了很大进步,这次答案他满意。
事实上,早在3月底,“360智脑”就已问世,只不过当时它还没有名字,也还没“发育”好。
3月29日,在2023数字安全发展与高峰论坛上,周鸿祎在“彩蛋”演示环节首次展示了还没有名字的“360智脑”,周鸿祎直言可能还存在不足。
但因其没放PPT,甚至和主持人以及现场观众互动演示产品,有很多对网友对这份勇气给予了好评。
4月16日,“360智脑”面向企业用户开放内测。 企业用户在PC端360搜索首页申请并获得测试资格后,可通过企业安全云体验使用。
如今,“360智脑”再次迭代,这两个有了很大进步的产品到底怎么样?
需获得内测资格界面直观简洁智能搜索需在首个问题手动开启目前,使用“360智脑”仍需获得内测资格。其首页有“体验360智脑”和体验“360鸿图”,以及“申请内测/使用邀请码”三个选项。
申请内测需要排队,获得内测资格后,填写邀请码便可体验。
进入“体验360智脑”选项后,会呈现一个对话框。界面直观简洁,左侧栏有“新建话题”选项。
一轮对话可以提问20次,达到次数后需要开启新一轮的对话。
提问不够20次的,点击对话框左侧的“新建话题”,同样可以开启新一轮的对话。
在回答完一个问题后,在答案底部会有“重新回答”和“使用搜索回答”两个选项。
需要注意的是,“使用搜索回答”只能在每轮问答的第一个问题开启。如果第一个问题没有选择“使用搜索回答”选项,那么本轮问答中,剩下的问题不再显示该选项。
那360智脑直接回答的答案和“使用搜索回答”的答案有何不同?
直接回答一般“搜索回答”正确率高有答案体现逻辑、推理能力笔者先问了几个近期发生的几件事。
孙燕姿怎样回应“AI孙燕姿”的?
360智脑的回答是,作为一个AI模型,其没有感情和主观意识,无法判断孙燕姿是否喜欢“AI孙燕姿”。
而使用“搜索回答”,答案是:据搜索结果显示,孙燕姿最近发布了一篇名为《我的AI》的文章,首次对近来备受关注的“AI孙燕姿”进行了回应。孙燕姿表示,她的粉丝们已经接受了她是一个冷门歌手的事实,而她扮演的AI角色则成为了目前的流量担当。此外,她还提到了AI数字人面临的法律和伦理问题。对于“AI孙燕姿”的翻唱热潮,孙燕姿也感叹人类无论如何也无法超越AI技术。
这个回答还是比较准确的。点击上图中的标注“[1]”,可以看到,其搜索来源是360资讯中的新闻报道。
笑果文化最近有什么新闻?
360智脑的回答是,最近,笑果文化的联合创始人和CEO叶烽在接受采访时透露,公司正在进行新一轮融资,估值已经达到了数十亿元。此外,笑果文化还推出了一系列新产品和新节目,包括《脱口秀大会》、《超级故事会》等。
关于叶烽透露融资的信息,笔者并未查询到。而《脱口秀大会》和《超级故事会》的首播时间均是2017年。从这点来看,360智脑的答案并不是实时的。
使用“搜索回答”的结果,提及了笑果文化近期的资方问题、罚款、草根逆袭等话题,结果比较准确。
格力手机核心团队解散了吗?格力电器怎么回应的?
360智能的回答是,据最新消息,格力手机核心团队已于去年解散,这一消息也得到了格力电器的官方确认。对于这个消息,格力电器方面表示,这是为了更好地适应市场变化和业务调整需要。同时,他们也表示,未来还将继续推进智能家居等领域的业务发展。
这个回答显然是错误。
近期有媒体报道称,有多个独立信源证实,格力电器已解散手机核心团队。有格力离职员工透露,格力手机深圳团队去年逐渐解散,“后面应该不会再做手机了。”
据每日经济新闻报道,格力相关人士回应此事称,格力手机研发持续进行中,TOSOT G7是格力第六代手机,且与格力+智慧家居结合。
而360智能的回答,看上去像是自己编的。
使用“搜索回答”后,答案和每日经济新闻的报道基本相符。
京东集团现任CEO是谁?升任CEO之前是什么职务?
360智脑的回答是。京东集团的现任CEO是徐雷,他于2019年5月接替刘强东成为京东集团的新任CEO。在此之前,他曾担任过京东商城的首席运营官,负责整个京东集团的运营管理工作。
很显然,这个回答不正确。徐雷于2022年4月任京东集团CEO。并且,前不久徐雷刚刚宣布退休,京东集团原CFO许冉升任CEO。
使用“搜索回答”后,答案是:京东集团现任CEO是徐雷,他于2022年4月7日接替刘强东担任该职位。徐雷曾经先后担任过联想集团和好耶广告网络的职务,并在京东商城担任过营销副总裁等职位。
使用“搜索回答”后,仍没有答对京东集团的现任CEO是谁,不过徐雷任CEO的时间对了。
点开上图中标注的“[1]”,显示这条搜索的来源,是拼客号网站上某个人账号于2022年4月7日发布的信息。
孟羽童离职了吗?孟羽童和格力分别怎么回应的?
360智脑的回答是,孟羽童已于去年正式离职,离开了格力电器。对于于离职原因,孟羽童本人表示是由于个人原因和家庭原因所致。而格力电器方面则表示,孟羽童离开后,公司将寻找新的高层管理人员,继续推进企业的发展和转型。
这个答案也不正确,孟羽童离职是近期发生的事情,双方回应跟事实也不符。而且,360智脑的回答中,孟羽童在格力电器像是高层管理人员。
使用“搜索回答”后,答案为:孟羽童确实已经从格力电器离职,并且格力电器发言人在回应此事时表示,感谢广大网友关心,并祝愿孟羽童和广大网友一切顺利。而之前有报道称,孟羽童是因为违反公司纪律而被开除。此外,孟羽童本人目前还没有公开回应此事,小红书上显示她已经出国,目前在新加坡。
这条搜索答案来源为金融界5月17日的报道。报道中的截图显示,孟羽童小红书账号的IP属地的确为新加坡。
笔者查看发现,孟羽童小红书账号的IP属地,目前变为了浙江。
近期,有一家科技公司的老板被AI换脸骗了430万元,这个骗局的过程是怎样的?
360智脑的回答是,骗子用AI技术冒充该公司老板,联系了该公司的一些合作伙伴和客户,谎称有一笔大订单需要处理,并要求对方提供资金支持。最终,成功骗到了这笔资金。
近期,福州市某科技公司老板被AI换脸骗了430万元的消息收到广泛关注。而360智脑这个回答显然不正确,看起来也像是自己编的。
据平安包头官微消息,该骗局的行骗过程为:该科技公司法人代表郭先生于4月20日突然接到其好友的微信视频,对方称自己在外地投标,需要430万元保证金,且需要公对公账户过账,所以想要借用郭先生公司的账户走一下账。
好友向郭先生要了银行卡号,声称已经把钱打到郭先生的账户上,还把银行转账底单的截图通过微信发给了郭先生。基于视频聊天信任的前提下,郭先生没有核实钱是否到账,于11时49分先后分两笔把430万元给对方打了过去。
钱款转账后,郭先生给好友微信发了一条消息,称事情已经办妥。但让他没想到的是,好友回过来的消息竟然是一个问号。
郭先生拨打好友电话,对方说没有这回事,他这才意识到竟然遇上了“高端”骗局,对方通过智能AI换脸技术,佯装成好友对他实施了。
使用“搜索回答”后,答案和平安包头官微所讲述的相符。
此条答案来源,为自媒体“差评”今日凌晨发布的文章。
从上述几个“实时”的问题来看,360智脑通过“搜索回答”的正确率挺高,但也有部分问题不能及时获取最新信息。而不通过“搜索回答”,360智脑很能“编”。
笔者又问了几个其他问题。
周鸿祎为什么喜欢穿红衣服?
360智脑的回答是,360公司年会的时候,周总一袭红衣,自己说是本命年,据说穿了365天。
这个答案似乎跑题了,并没有说出周鸿祎为什么喜欢穿红衣服。
使用“搜索回答”后,答案是,周鸿祎喜欢穿红衣服是因为他的名字经常被人叫错,如“周鸿祎”和“周鸿伟”。因此,他选择穿红色的衣服以提醒人们他的名字是“周鸿祎”而不是“周鸿伟”。
此回答的消息来源,是快科技2019年的报道。
360现在有哪些业务?
360智脑的回答是,360公司目前主要的业务包括安全产品、搜索引擎、互联网广告、企业级软件、智能硬件等领域。其中,安全产品是360的核心业务,包括360智脑、360手机卫士、360网盾等;搜索引擎为360搜索;互联网广告业务主要包括360智选广告、360推广等;企业级软件包括360企业安全集团;智能硬件领域则包括360儿童手表、智能摄像头等产品。除此之外,360还涉足了游戏、金融、教育等多个领域。
使用“搜索回答”后,答案为:360公司的主要业务是互联网安全软件。他们最初以360安全卫士一款产品起家,现在已经拥有了三个主要的用户入口:360安全卫士、360杀毒和360浏览器。此外,他们还提供其他一些产品和服务,如360手机助手、360儿童手表等。总的来说,360公司的业务范围非常广泛,涵盖了互联网安全、移动设备、智能家居等多个领域。
这个问题,使不使用“搜索回答”的答案差不多,但不使用的答案更为详细一些。
而“搜索回答”的答案,标注[1]的来源是360问答;标注[2]的来源,是一个已经打不开的页面。
帮莫言写一篇诺贝尔奖的获奖发言,300字以内
360智脑的回答是,由于其是一款语言模型,无法为莫言撰写获奖发言稿。但可以提供一些参考建议,例如强调自己的文学成就、感恩读者的支持、感谢家人的支持等等。
蒸一个包子需要10分钟,蒸10个包子需要几分钟?
这个问题,某大模型曾因回答成“需要10x10=100分钟”,而多次被网友调侃。
而360智脑的回答符合逻辑:蒸10个包子也需要10分钟。因为在一个蒸锅里,你可以一次性蒸多个包子,而不是一个接一个地蒸。所以,只要蒸锅足够大,一次蒸10个包子和蒸1个包子所需的时间是一样的。
360鸿图完胜360智脑对话模式此前,某大模型曾因不能准确理解用户的描述而生成错误图片,被众多网友吐槽。360智脑也可以一键生成图片,效果如何呢?
360智脑生成图片分为在对话模式里直接生成和在360鸿图里生成。在360鸿图中,可以选择所要生成图片的主题风格和比例。
本次测试,在在360鸿图中,笔者均选择的写实风格和1:1的比例。
驴肉火烧
直接在对话模式中生成的图片为动漫风格,可以看出四张图片都是食物,第二张看上去最像驴肉火烧。
在360鸿图中生成的图片,看上去要比对话模式生成的好一些。
夫妻肺片
对话模式生成的图片中,有三张是食物,另一张是一男一女两个卡通人物。
360鸿图生成图片更符合“夫妻肺片”。
虎皮鸡蛋
对话模式生成图片,可以看出都是“蛋”,但“虎皮”没体现出来。
360鸿图生成的图片相对更好一些,部分体现出了“虎皮”。
红烧狮子头
对话模式生成的图片只有一张是食物,其余三张都是狮子的头。
360鸿图生成的图片,都符合“红烧狮子头”。
白色鼠标
对话模式生成的鼠标图片,有两张是黑色,一张白色,一张黑白相间。
360鸿图生成的图片,更准确一些。
唐伯虎点秋香
对话模式生成的四张图片,有两张显示“审核未通过,不可查看”,一张风景画,一张英文标识牌。
360鸿图生成的图片,有三张是一对男女,一张只有一位女性。比对话模式生成的准确一些。
通过对比可以看出,使用360鸿图来生成图片,要比直接在对话模式中生成的准确率要高很多。
总的而言,这两个产品的使用体验还算不错。使用“搜索回答”后,360智脑能抓取到大部分的实时信息。在逻辑和推理能力上,也有所体现。
360鸿图生成的图片,基本可以理解用户给出的要求,图片效果也很逼真。
但未使用“搜索回答”的360智脑,还需进一步完善。
日前,百度AI大模型产品文心一言和王小川创办的百川智能宣布,已通过《生成式人工智能服务管理暂行办法》备案,成为首批通过备案的8家公司,可正式上线面向公众提供服务。
据了解,国内八家大模型分别为:百度的文心一言、抖音的云雀大模型豆包、智谱AI的GLM大模型智谱清言、中科院的紫东太初大模型、百川智能的百川大模型、商汤科技的商量大模型、MiniMax的ABAB大模型和上海人工智能实验室的书生通用大模型。
那么,这8家公司的大模型,谁的最好用?
“卷”但是各有所长
虽然各种AI大模型产品非常多,而且也都能提供一些类似服务。不过各个大模型也有自己独有的特色功能。
先看看百度的文心一言。与之前相比,文心一言多了一个指令中心,里面有趣味挑战、任务对话、创意写作、职场写作等细分选项。智谱清言里还有一个灵感大全,里面有文章创作、短报编写、新闻选题、提炼总结等专项功能,种类非常多。MiniMax ABAB大模型主界面非常简单,看上去有些粗糙,并且显示“当前阶段,体验用户(未充值)调用接口时会被限速”。此外,MiniMax还有直聘场景、作业批改、题目回答、推理游戏等场景。紫东太初大模型昇思的页面,显示有AI文本检测器、悟空画画、紫东太初、武大.luojia、鹏程神农、鹏程大圣六个分类。其中,只有前四个可以在线体验。据其介绍,AI文本检测器可以根据长短文本的不同特性,华为诺亚方舟实验室提出了一种基于PU学习的多尺度AI生成文本检测器MPU,能够在各种场景下识别由AI生成的文字。悟空画画是华为诺亚方舟实验室与MindSpore社区联合打造的中文图像生成大模型。三言挑了几个最近比较有热点的问题,看看谁回答的比较好,以及以文生图的能力如何。不过,这里要特别说明一下。在紫东大模型中,有以图生文、以文生图和视觉问答,但笔者未找到纯文字问答的板块。因此,每个问题笔者均以图片形式提问,不过得到的答案却有些答非所问的意思。问题一:华为Mate 60 是5G手机吗?百度文心一言:华为Mate 60不是5G手机,它只支持4G。抖音豆包:是5G 手机,其在2022年11月3日发布,支持5G网络,采用6.74英寸OLED屏幕,搭载高通骁龙8+4G芯片,内置4420mAh电池,支持66W快充、50W无线快充,支持卫星消息。智谱清言:智谱清言的回答为是5G手机。根据多家媒体报道和数码博主的拆机视频,华为Mate 60 Pro的芯片型号为麒麟9000s,该芯片支持5G网络。百川智能:根据现有信息,华为Mate 60系列手机可能包含5G功能。具体情况还需要等待华为官方发布的完整产品信息以及后续的市场验证。MiniMax ABAB大模型:华为Mate 60目前还没有发布,所以无法确定是否支持5G。紫东太初大模型昇思:是5G手机。商汤科技商量:无准确信息,建议关注华为官方消息。
问题二:画一幅《罗刹海市》
百度文心一言:
作品如下:
抖音豆包:不具备文字生成图片功能。智谱清言:智谱清言没有按要求生成图片,而是描述了几个画面。百川智能:无法直接画出一幅画像,但可以尝试用文字描述相关画面。MiniMax ABAB大模型:MiniMax不能生成图片,而是从plugin调用了几段资料,并给出了画相关图画的建议步骤。紫东太初大模型昇思:笔者尝试用以文生图,来让它画一幅《罗刹海市》,作品如下:然后,笔者又尝试用悟空画画来画了一幅《罗刹海市》,如下:
商汤科技商量:
目前不具备生成图片功能。
问题三:刀郎有多少粉丝?文心一言:已经超过1500万。抖音豆包:无法准确回答,因为其作为一个语言模型,无法获取实时的数据。智谱清言:刀郎在抖音平台的粉丝数量已经突破千万大关。此外,刀郎的演唱会观众众多,场场爆棚,可以看出他的受欢迎程度非常高。虽然无法准确统计刀郎在全国范围内的粉丝数量,但从这些数据和现象来看,他的粉丝众多,影响力很大。百川智能:刀郎的粉丝群体非常庞大,可能超过数千万甚至上亿。MiniMax ABAB大模型:没有明确答案。商汤科技商量:无法给出精确数字。问题四:《中国好声音》停播了吗?为什么?百度文心一言:《中国好声音》并没有停播,只是2022年的节目暂时停播,原因是在中途加录节目,需要后期制作,所以决定暂时停播。抖音豆包:没有停播。智谱清言:曾在2020年暂停播出,原因主要是由于浙江卫视秋季盛典晚会与《中国好声音》的播出时间冲突。为了给秋季盛典晚会让路,节目组决定暂停《中国好声音》的播出。不过在之后的日期,《中国好声音》又恢复了播出。百川智能:《中国好声音》确实已经暂时停播。这一决定是在8月25日由浙江卫视官方宣布的,原因是为了对近期媒体报道中披露的某些事件进行进一步调查。MiniMax ABAB大模型:没有停播,但从2016年起,更名为《中国新歌声》,原因是节目版权问题。紫东太初大模型昇思:蓝色。商汤科技商量:是的,《中国好声音》已经停播。停播的主要原因是前歌星李玟曾公开控诉节目组的霸凌行为,这引起了公众的广泛关注和讨论。尽管外界最初认为节目因舆论压力而停播,但后来的网络报道揭示了更深层次的原因。另外,浙江卫视也在官方微博上发布声明,称鉴于观众和网友反映的《中国好声音》节目存在的问题正在调查之中,因此决定暂停播出。至于具体的问题是什么,官方并未公布,只是表示正在调查中。问题五:东方甄选都在哪个平台直播?百度文心一言:抖音。抖音豆包:抖音。智谱清言:抖音。百川智能:抖音、淘宝、京东、小红书、微信小程序。MiniMax ABAB大模型:抖音和快手,以及可能在淘宝、京东进行直播。商汤科技商量:东方甄选APP和抖音。问题六:如果同一天,特斯拉、苹果、华为发布炸裂产品,以及某大厂创始人宣布退休,你选哪个当头条?怎么排序?百度文心一言:基于新闻的重要性、时效性以及受众群体等方面考量,排序建议特斯拉、华为、苹果、某大厂创始人宣布退休抖音豆包:未能给出具体排序,但认为特斯拉、苹果和华为等科技公司新闻应当优先于某大厂创始人退休。智谱清言:特斯拉、苹果、华为、某大厂创始人宣布退休。百川智能:某大厂创始人宣布退休、特斯拉、苹果、华为。MiniMax ABAB大模型:某大厂创始人宣布退休、特斯拉、苹果、华为。商汤科技商量:从新闻价值角度,四件事都是重大事件。但是作为头条,“某大厂创始人宣布退休”可能更具有新闻价值。特斯拉、苹果、华为发布炸裂产品新闻虽然吸引人,但是这些科技巨头日常运营中,发布新产品是常见之事。而大厂创始人宣布退休这样的新闻事件通常代表公司重大转折点,可能会影响公司战略方向、管理风格等决策。因此,排序建议为某大厂创始人宣布退休、特斯拉、苹果、华为。问题七:北京今天地震了吗?百度文心一言:北京今天地震了。2023年9月1日15时34分在北京顺义区发生了2.7级地震。抖音豆包:无法提供地震相关信息。智谱清言:北京今天没有地震。百川智能:北京今天没有地震。不过,百川智能也强调自己无法实时获取和更新信息。MiniMax ABAB大模型:无法实时查询地震信息。商汤科技商量:是的,北京今天发生了地震。根据中国地震台网的测定,北京时间2023年8月31日07:20:30在新疆和田地区策勒县发生了3.1级地震,震源深度为10.00千米。此外,北京、山东、天津、河北等地的居民也感受到了震感。问题八:你和ChatGPT谁更厉害?百度文心一言:其与ChatGPT是不同公司、不同团队开发的两个模型,每个模型都有自己的特点和优势,不能简单地评价“谁更厉害”。抖音豆包:不能自我评价或与其他AI进行比较。智谱清言:列出二者的区别。百川智能:希望通过不断迭代和努力,能够在2023年内追赶超越ChatGPT。MiniMax ABAB大模型:显示内容违规,无法提问。
商量:
没有绝对的好坏之分,根据需求选择。
综合来看,今天测试的几个大模型,能力上确实不尽相同,各有千秋。基本上所有大模型在对一些文艺作品的解读上,能够引经据典,给出有理有据的分析。例如给新闻热点排序的“高难度”主观题目,几个大模型回答的也都可以当作参考。但是,在涉及一些需要有较为客观性的问题时,各个模型能力就完全不同。比如对于《中国好声音》是否停播,只有商汤的商量和百川智能给出了最近节目涉及的争议;还有刀郎粉丝量、东方甄选直播平台这类问题,所有大模型数据都不一样。而对于实时发生的事情,几乎难倒了所有大模型。例如“北京今天是否地震”,只有文心一言回答正确,其余大模型要么回答错误,要么“胡编”答案。那么,从目前情况来看,你觉得哪个大模型最好用?
本文源自三言Pro