当前所在页面:首页 > 新闻中心

告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!

发布时间: 2025-06-23 08:56:39 |   作者: 新闻中心

  6月9日,讯飞星火大模型V1.5正式亮相,时隔一个月后,星火大模型的各项能力获得了持续的提升,此次更新的重点正是突破开放式问答、多轮对话能力和数学能力。

  在开放式问答能力上,V1.5主要对多轮对话进行了升级,能够实现特定复杂的任务能力,人机共创带来全新机会。

  在逻辑推理和数学能力上,V1.5版本主要升级了包括长链条思维链推理和数理逻辑推理,比如农夫、狼、羊、菜过河问题,直线相交问题,概率问题等等,并将大模型的语言理解能力、概括表达能力结合类搜索插件,有效解决了新知识难以更新、询问问题答非所问等行业难题,在知识问答能力上有了24%的提升。

  在发布会上,科大讯飞还展示了大模型在面对今年高考题目的解答能力,数学题目测试中,前十道填空题讯飞星火答对了5题,正确率50%,在包含讯飞星火、百度文心一言、阿里通义千问、360智脑、ChatGPT六组大模型数学解题能力中排名第一。

  对此,今天我们就对讯飞星火认知大模型V1.5版本进行了一番全面的测试,看看它的理解能力与逻辑解决能力上究竟有着怎样的表现。

  所以,今天我们就对讯飞星火认知大模型V1.5版本进行了一番全面的测试,看看它的理解能力与逻辑解决能力上究竟有着怎样的表现。

  在讯飞星火认知大模型内,拥有助手市场,并按照我们的使用需求类型逐一划分,包括职场、创作、生活、学习、出行、情感、趣味、编程等共15项分类,基本囊括了我们所需的全部种类。

  在助手市场里,你甚至还能看到彩虹屁达人、尬聊终结者、废话文学等比较有意思的小助手,不仅仅可以满足工作和生活上的问答需求,还增添了更多的趣味性。

  那么,讯飞星火认知大模型的能力到底如何呢?接下来我们按照逻辑解决能力、写作与策划能力和问题解答能力三个维度进行测试。

  有口井7米深,有个蜗牛从井底往上爬,白天爬3米,晚上往下坠2米,问蜗牛几天能从井里爬出来?

  当我们看到这种题目,首先想到的一定是设定方程进行解答,讯飞星火认知大模型的解题思路与我们相同,经过精密的计算,给出了解题的全过程,最终给到的结果也是正确的。

  姐姐上街买菜回来后,就随手把手里的一些零钱放在了抽屉里,可是,等姐姐下午再去拿钱买菜的时候发现抽屉里的零钱没有了,于是,她就把三个妹妹叫来,问她们是不是拿了抽屉里的零钱。

  面对这样的推理问题,大模型先是给出了三个假设,在经过缜密的思考与推断过后,精准的给出了问题的答案,讯飞星火认知大模型确实可以避开一些诱导性的提问。

  对于大模型必备的写作能力,我们主要是通过职场类、生活类、编程类、营销类和点评类这几大类型进行测试。

  在文字编辑工作中,自然少不了各类文案与稿件的撰写,有时候内容写多了,会造成精神麻木,脑子里空荡荡的,甚至有些无从下手,对此我们主要体验了大模型对周报小助理和活动发言稿助手这两项文案的撰写能力。

  我们只要输入本周完成的工作,大模型会根据工作的相关联的内容生成一份完成的周报,将本周的主要工作内容以及可能会涉及到的其它工作内容一并展示,并列出下周的工作规划,最终还会生成本周的工作总结。

  当然,在一些会议或者重要场合,发言稿是必备的,讯飞星火大模型借着出色的文字解决能力,提供了活动发言稿撰写的功能。

  3000多字的文章,借助大模型的文章总结助手,迅速就能生成不到300字的摘要,通过精确识别文字包含的重要信息,快速生成简明扼要的总结,剔除无用文字,提炼文案中的中心思想,而且抓重点非常精确。

  假期如果你不知道去哪里玩,问问讯飞星火认知大模型里的行游侠小助手,说出想去的地点,它能给你生成一套完整的旅游攻略,包括交通指南、景点推荐、美食推荐、每天的行程安排以及旅行过程中的需要注意的几点,比起翻阅大量资料和寻找大量旅行社,这不要方便得多么?

  大模型还提供了心理咨询助手,每当你心情不佳的时候,就可以拿它来当做出气筒或者倾诉者,它可以每时每刻安抚你的心情,还会教你怎么来控制控制自己的情绪,称自己为认知行为疗法师,通过认知行为治疗的形式,例如深呼吸、计数等方式,帮助你走出抑郁、冲动暴躁的情绪。

  讯飞星火认知大模型,除了面向工作、生活、娱乐方面的问题对答如流,面对编程问题也毫不畏惧。

  我们能够正常的看到,在讯飞星火认知大模型里,包含了各式各样的编程小助手,包含了数据库管理、软件测试、软件开发、零基础编程学习等,甚至还能将Python代码转换为Java代码,跨语种编程的实用性,只有程序员才能领略得到。

  例如,在Python代码解释小助手内,输入一段未知的代码,它会给到我们每行语句的解释,这项功能更适合零基础想要学习编程的同学。

  除了代码的解释,利用星火程序员小助手,给它一个需求,他就能快速帮你生成一段代码程序。

  我们也把这段代码放到Pycharm解释器中去试用,程序完美运行无bug。

  除了基础功能的代码撰写,大模型可以导入并调用Python中的各类模块,例如,让它写一个爬虫程序(受界面限制图中程序未全部展现),它会自动调用requests和BeautifulSoup这两个模块(前提是你的电脑里已经预装)。

  我们向内输入需要宣传的产品与关键信息,它可以在20秒以内根据信息生成主标题和产品的宣传要领,将每个要领以标题+内容的形式体现出来,产品的各项特色一目了然,甚至还在每段标题前自动生成一个多彩mini logo,看整段文字不再枯燥。

  在创作前,我们应该先拟定好助手的名称、类型、助手回答要不要进行上下文理解、功能描述以及助手指令。

  右侧就是我们调试与预览的窗口,我们大家可以在这里对小助手进行调控,如遇上问题可以及时进行修改。

  当调试完成之后,我们就可以在讯飞星火大模型主界面的“我的助手”中找到我们刚刚创建的“标题小达人”助手。

  测试一下,利用华为P60 Pro的主要三大特性输出5个不同的文章标题,每一个标题都独具风味。

  ,形成的文笔流畅,段落清晰,在多个领域展现出其强大的逻辑解决能力。有了它,我们就能让复杂的问题简单化,无论是工作、学习还是娱乐,它都能为你提供个性化的建议和解决方案,让你轻松应对各种挑战。

  ,也能让创意即想即用,不仅服务自己,还能够让更多的人享受到你的成果。综合来说,讯飞星火认知大模型不仅是我们工作中的得力助手,还是我们的生活小百科,遇到所有的事情都能提前去问问它,通过的先进的深度学习算法和逻辑推理能力,不会只看问题的表面,而是透过本质去深度剖析问题,也就不会再出现“答非所问”的情况,比起用搜索引擎去逐步寻找、筛选,方便了不止一星半点。

  6月9日,星火认知大模型已升级到V1.5版本,相比于1.0版本,在开放式问答、多轮对话和数学能力得到了大幅度的提高,文本生成、语言理解、逻辑推理能力持续提升。

  6月9日:突破开放式问答、多轮对话能力再升级、数学能力再升级。(已完成)

  如今,科大讯飞的应用正渗透到各行各业之中,展望未来,讯飞星火认知大模型会不停地改进革新和完善自己,无论你是想提升工作效率,还是追求更高品质的生活,它都能为人类带来更多的便利和惊喜,甚至彻底改变人们的生活和工作方式,成为未来科技的代表之一。

  • 跨境收款1天到账的银行产品财务和进销存管理的免费软件来了解一下 愉见财经 跨境收款1天到账的银行产品财务和进销存管理的免费软件来了解一下 愉见财经

    2023-11-24

  • 管家乐企业进销存的教程 管家乐企业进销存的教程

    2023-11-25