Ant Group Zheguyu宣布了AI的四个主要挑战:所有数据
发布时间:2025-05-18 09:07
5月18日上午,技术新闻于5月17日上午,在第三届Oceanbase Developer会议上,Oceanbase发布了AI,PowerRag的应用产品,该产品提供了抹布盒的应用程序开发功能和AI时期的Oceanbase Explorations之一。过去,首席执行官杨·本(Yang Bing)通过一封工作人员宣布,该公司完全进入了AI时期。 Oceanbase专注于开发×AI数据功能,并在AI期间促进了集成数据库的集成数据库的战略演变。预计将通过计算,基础架构,平台级别,应用程序级别和将来的交付格式实现全面的布局。 Ant Group cto She Zheguyu在会议上分享了题为“大规模数据(AGI保护)带来的隔离变化”。他认为,当今互联网上的大量数据已经创建了很大的模型,但是旋律的大问题来源Y -Guni也是数据的问题。数据确定了大型模型功能的上限,并且仍然存在四个主要挑战:首先,获得数据的成本增加了戏剧性的需要更强的处理能力,而第四个数据质量评估很困难。 他说,Zheguyu是蚂蚁集团将支持Oceanbase在财务,医疗和生活等主要AI情况下的成功,并支持Oceanbase进行Dataxai概念和建筑变革。同时,开放资源继续支持和开放海底,逐渐开放了该行业数据×AI的功能,并为AGI梦想做出了贡献。 以下是他分享的全文: 您好,海底开发人员!我很荣幸有机会与您谈论通用人工智能(AGI)。我为什么要去这次会议?我真的认为我应该说的第一件事是没有数据,肯定有今天没有AI和大型模型;没有开发人员的增加和爆炸,就没有AI应用程序。正是数据的力量创造了AI和当今的大型模型,而开发人员生态系统的剧烈发展和持续变化是真正促进AI应用程序爆炸的主要机器。我今天要分享的话题是“在AGI时期,大量数据带来的卢伯利亚变化” AI开发是HIIT的真正光滑航行,甚至是线性的。这是AI发展的第四次爆炸。 AI终于变得普遍,并在这里拥有巨大的市场机会和商机。发布时,您会发现许多最初需要创建特殊模型的任务,包括翻译,写作,对话等,需要智能模型。从我们的角度来看,它与“长尾理论”一致。并非所有人都知道您是否有印象。克里斯·安德森(Chris Anderson),前著名马的总编辑Gazine Technology在他的早期作品中“电线”:在书中,他说成功的关键在于纳入所有艰苦的脂肪销售书籍,所有这些书籍都在货架上。遵循的权力法对实用技术并不是一个陌生的人 - 当需要大量的聚集体效果时,其整体超过了任何单一主流市场的规模。 AGI现在的意思是什么?当前的Agagi成功在于单个模型或解决方案完成许多AI任命活动的能力。在实施这些基本功能时,我们看到对瘀伤应用的需求成倍增长。这些请求的叠加可能会超过现有的AI市场的总和,这表明技术革命驱动的商业爆发即将到来。许多人将享受更大,更好的AI服务。对于基础设施开发人员和技术团队,有三个挑战:服务体系结构的开发HAT支持巨大的需求,继续降低计算成本,并继续使智能系统的性能局限性延续。只有通过三个维度的同时进步:规模经济,控制控制和技术突破,我们才能理解这场智能革命的战略机会。智力的追求。 数据是什么意思? “数据边界定义了智能的上限” - 许多人同意这句话。著名的物理学说“我无法创造的是我不理解”也是特别深的,这是发展人工智能的指南。在这个灵感的启发下,我们可以说:如果您不能成为数字化,那么您就不能聪明。一方面,数字化的过程是创建智能的过程:模型本身需要数据,这更易于理解;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;此外,将物理世界变成数字形式,无论是文本或图像是人类智力的结晶。另一方面,由于特定领域中数据或质量缺陷的丢失,大型模型面临的大多数幻觉问题至关重要。当模型遇到空白的数据区域(作为模型训练的目的)时,基于可能性的生成将导致结果不准确。这种认知是成反比的基本逻辑:数据质量和改进数据系统是幻觉的根源所做的。 现在,我们认为AGI在数据领域仍面临许多挑战。这是与您所看到的简短分享: 首先,获得数据的成本大幅上升。 Openai首席科学家Ilya Sutskever曾经使用寓言,即“数据是人工智能的石化原材料”,以显示行业的困境:互联网的公共资源,因为在模式下大型模型培训的基础L,几乎筋疲力尽。这种耗竭不是物理疲劳,而是一种易于获得的廉价数据源。由于互联网数据,每个人都可以访问。使用廉价数据时,仅保留真正的昂贵数据。如果一家公司在将来成功,与其消耗数据的消耗方式无关,而是关于如何通过高质量数据来制作的,这将是未来任何数字业务的成功标准。 其次,行业数据的困难流通。我们注意到一个重要的问题,该行业的耐用性与数据的可用性(即工业数据和缺陷)徒劳相关。极度严格的行业(例如法律和医疗服务)具有三重特性:捕获数字化过程,严格的数据质量要求以及数字基本知识的积累不足,这共同导致结构性缺乏高质量的数据。 AI开发在专业中的有效应用Sional领域不仅需要高密度的垂直领域知识(包括正式逻辑和推理原因等认知范式),而且还依赖跨工业知识传递能力。以DeepSeek-R1为例,它通过代码的逻辑过渡到文本创建的过渡在技术上已证明是可能的,但是在专业领域,明智的落在专业领域仍然面临着主要的瓶颈 - 系统会系统地改变隐性知识,例如在可计算模型中对范式和专业政策的特定思考?如果这种瓶颈是不可抗拒的,它将严重收紧专业领域的明智过程。 第三,很难多模式数据处理。我认为不容忽视的主要事情是我们所处的世界是三维而不是线性的。未来的数据不仅应包括文本,而且还应包括许多愿景,甚至包括触摸,包括更多本体论,以及一系列机器人是n欠谈。它可以预测,即使当前的大型模型也可以处理文本(令牌)的数十亿个单位,将来的数据大小仍然会增长。我们将在大量未来数据面前面临的是另一个巨大的挑战。 第四,评估的质量很困难。如您所知,大型模型的最困难问题是如何检查它,评论的质量决定了模型的质量。什么是分析?评论本身也是数据。它需要大量的评估数据,大量的人类思维或人类知识数据。如何获取这些数据也是一个巨大的挑战。否则,在练习大型模型时,我们将永远像“ elixir”,并且只有在释放它后它是否好。 以上问题是我们至今已注意到的挑战。如何克服这是一个悬而未决的问题,这是由Mamany Companies克服的。可以解决任何问题的公司这可能是一家很棒的商业公司。我们有一个可以与您分享的句子:将来,所有数据公司将是AI公司。 Oceanbase诞生于目标,更多的场景。以前,由Oceanbase开发的有关大规模交易数据开发的最新技术已应用于内部蚂蚁组的内部情况。我们领导了完全分布的数据库体系结构的应用,以应对我们面临的IOE价格挑战。在这里,我们建立了一个技术系统,包括灾难恢复和大量数据服务功能。可以说,没有任何简单性,即Oceanbase是连续蚂蚁群体变化和破坏技术行业困难的代表。在将来看,我坚信,海底将继续开花以实现梦想中的Agi。在上面的问题中,我相信海底有很大的潜力。 蚂蚁小组将支持海底,以打破一些主要的AI情况,包括突破在基本的ANT AI情况下,例如财务,医疗和生活,并支持海底进行Dataxai的概念和框架。现在,AI的竞争已经进入了深水。 AI的竞争不仅是模型的竞争,而且还是公司甚至行业基础设施的竞争。基础设施的影响是直接确定模型的效果。 同时,蚂蚁集团将继续支持Oceanbase开源并开放,并逐渐打开Kaksdata×AI,并提供数据X AI Infra Innovative Services的全部数据。我们想利用一点力量为我们的行业和梦想做出贡献。 最后,我想结束今天分享的著名图灵报价,印在50英镑中:“这是对未来事物的初步希望,这只是未来事物的阴影。” Agi有一个伟大的梦想,并希望与所有开发人员一起行走。 金融的官方帐户 24小时Br浏览最新的财务和视频信息,并扫描QR码以供更多粉丝遵循(Sinafinance)
购买咨询电话
400-123-4567