在种种冲击之下,大厂纷纷改变路线,一边打不过就加入,纷纷宣布接入DeepSeek,一边将自家大模型从闭源转向开源,甚至不惜自断一条商业化路径,将C端产品免费。
2月末,汉数科技以“南北联动”的创新模式,同期在广州、北京两地举办「太擎」产品发布系列活动,活动诚挚邀请了政府代表、客户代表、生态伙伴以及代理商,各方齐聚一堂,共襄盛举。通过多场专场讨论以及深度交流,与会人员深入剖析产品落地策略,实现产品与市场的精准对接。
大会以“好用、易用、愿用——以突破性创新加速AI赋能千行百业”为主题,设置“1+9”总体结构,即1个开幕式(主论坛)、9个分论坛,聚焦人工智能前沿技术与产业发展。
近日,AI 工程师和技术作家 Andriy Burkov 发布了一份「从头开始写 GRPO 代码」的教程,其中介绍了如何基于 Qwen2.5-1.5B-Instruct 模型构建一个使用 GRPO 的分布式强化学习流程。
DeepSeek 官方在知乎发布《DeepSeek-V3 / R1 推理系统概览》一文,详细介绍如何使用大规模跨节点专家并行(Expert Parallelism / EP)来增大 batch size,如何隐藏传输的耗时,如何进行负载均衡。
2月28日消息,今日,DeepSeek开源周第五天,也是最后一天,亮出的是3FS,一种高性能并行文件系统。3FS(Fire-Flyer File System)专为充分利用现代固态硬盘(SSD)和远程直接内存访问(RDMA)网络的带宽而设计,能够加速对数据存储和访问。
近日,零一万物CE0兼创新工场董事长李开复出席了一项目合作大会并发表了主题演讲。在演讲中,李开复从技术演进的角度深入剖析了AI爆发式增长的动力。他回顾了人类历史上的两次IT革命——PC时代和移动互联网时代,指出这两个时代都极大地推动了全球GDP的增长。
在数智化转型的浪潮中,人工智能技术正以迅猛之势重塑着各个行业的格局。「太擎」以破局者的姿态,正式宣布其核心产品“问答引擎”已深度接入DeepSeek系列模型(DeepSeek-R1、DeepSeek-V3)。通过接入DeepSeek系列模型,「太擎」的问答引擎实现了知识推理问答能力的全面升级。
开源模型,还是得看杭州。前脚发完QwQ-Max,阿里就在深夜开源了视频生成模型Wan 2.1,14B参数直接屠榜VBench,什么Sora、Gen-3通通不是它的对手。
共8页,73条内容