九游会·j9官方网站"> 九游会·j9官方网站,这是一个为宠物爱好者打造的平台,提供全面的宠物护理知识、训练技巧以及宠物产品推荐。在这里,您可以与全球的宠物主人交流经验,分享爱宠的点滴生活。无论是初次养宠物,还是经验丰富的主人,您都能在这里找到有用的资源《九游会·j9官方网站》一款永久免费的手机加速和空间清洁软件,超加速让手机运行更加顺畅,一键清洁快速处理内存不足,是清洁软件的领导者。贴心隐私保护清除痕迹,轻松清除无痕迹,保护手机隐私不泄露,强力清除垃圾,一键防删错。。️">
🈁第一步:🍭访问九游会·j9官方网站官方网站或可靠的软件下载平台:访问(http://bjssckj.cn/)确保您从官方网站或者其他可信的软件下载网站获取软件,这可以避免下载到恶意软件。
🈁第二步:🥇选择软件版本:根据您的操作系统(如Windows、Mac、Linux)选择合适的软件版本。有时候还需要根据系统的位数(32位或64位)来选择九游会·j9官方网站。
🈁第三步:⚓️下载九游会·j9官方网站软件:点击下载链接或按钮开始下载。根据您的浏览器设置,可能会询问您保存位置。
🈁第四步:💦检查并安装软件:
在安装前,您可以使用杀毒软件对下载的文件进行扫描,确保九游会·j9官方网站软件安全无恶意代码。
双击下载的安装文件开始安装过程。根据提示完成安装步骤,这可能包括接受许可协议、选择安装位置、配置安装选项等。
🈁第五步:⛩启动软件:安装完成后,通常会在桌面或开始菜单创建软件快捷方式,点击即可启动使用九游会·j9官方网站软件。
🈁第六步:🏔更新和激活(如果需要): 第一次启动九游会·j9官方网站软件时,可能需要联网激活或注册。
检查是否有可用的软件更新,以确保使用的是最新版本,这有助于修复已知的错误和提高软件性能。
🗼欢迎使用🔥【九游会·j9官方网站】🈁🎡️🈁支持:32/64bit🈁系统类型:九游会·j9官方网站(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)创建于2005年,最初只是一个小型的体育资讯网站。经过多年的发展,如今已经成为了国内知名的体育赛事报道媒体。的创始人是一群热爱体育的年轻人,他们深知体育在人们生活中的重要性,希望通过,为更多的人传递体育的魅力。。
✈️恭喜发财🍼【九游会·j9官方网站】🈁🌋️🈁支持:16/32bit🈁系统类型:九游会·j9官方网站(中国)官方网站IOS/安卓通用版/APP下载(2024APP下载)平台汇聚了国内外最新、最全面的体育新闻资讯,包括赛事报道、赛程预告、球队动态、选手专访等,让你随时随地掌握最新的体育动态。。
🛸大吉大利🚨【九游会·j9官方网站】🈁🏢️🈁支持:32/64bit🈁系统类型:九游会·j9官方网站(中国)官方网站IOS/安卓通用版/APP下载(2024APP下载)平台还提供了多种社交互动功能,包括用户评论、点赞、分享等,用户可以通过这些功能与其他体育爱好者进行交流和互动,分享自己的观点和看法。。
🗼勇闯无限🎈【九游会·j9官方网站】🈁🚋️🈁支持:32/64bit🈁系统类型:九游会·j9官方网站(中国)官方网站IOS/安卓通用版/手机app下载(2024APP下载)平台汇聚了国内外最新、最全面的体育新闻资讯,包括赛事报道、赛程预告、球队动态、选手专访等,让你随时随地掌握最新的体育动态。。
🏝网页认证🏝【九游会·j9官方网站】🈁🍩️🈁支持:32/64bit🈁系统类型:九游会·j9官方网站(官方)网站IOS/Android通用版/手机app下载(2024APP下载)未来,将继续坚持自己的特色,不断创新和进步。将会加强与各大体育联盟和俱乐部的合作,为广大体育爱好者提供更加丰富、全面的赛事报道。同时,也将会通过更多的渠道和方式,让更多的人了解体育,爱上体育。。
💰百度热搜🧀【九游会·j9官方网站】🈁🦷️🈁支持:32/64bit🈁系统类型:九游会·j9官方网站(官方)官方网站IOS/Android通用版/手机app下载(2024APP下载)彩网将持续优化平台,提供更加丰富的赛事内容和更加优质的用户体验。未来,还将加大对电竞等新兴赛事的支持,为用户带来更加多元化的娱乐选择。。
🧸2024百度百科🥇【九游会·j9官方网站】🈁🚂️🈁支持:32/64bit🈁系统类型:九游会·j9官方网站(官方)登录入口APP下载IOS/安卓通用版/手机APP下载(2024APP下载)的商业模式主要是广告收入和会员收入。通过广告投放、赞助合作等方式获得广告收入,同时也推出了会员服务,为用户提供更加个性化的服务,从而获得会员收入。。
【《闪耀暖暖》福利活动“轻聆风语”限时开启 “幻之海·流光”全新套装上线******
叠纸游戏自研自发的次世代3D手游《闪耀暖暖》于11月10日迎来更新,稀有服饰福利活动“轻聆风语”限时开启,“幻之海·流光”上线全新套装“初遇格海”;“金雪新意”主题活动第一弹来袭,“新意节会场”专属折扣商店限时上架……更多丰厚福利资源和最新玩法,还待玩家尽情探索!
“幻之海·流光”套装更新 全新稀有套装“初遇格海”上线
此次游戏更新后,全新稀有套装“初遇格海”将在“幻之海·流光”与玩家见面。11月10日至11月19日,“稀有·初遇格海”及“非凡·佣兵女王”将在幻之海·流光获得限时概率UP。除常规感应外,每期“幻之海·流光”还可消耗星钻优惠进行“限定感应”。
参与限时拼图大挑战 获取稀有福利服饰“轻聆风语”
此次游戏更新后至11月24日,“轻聆风语”巧趣拼图稀有服饰福利活动开启。玩家参与限时拼图大挑战,在限定时间内完成拼图即为挑战成功,成功可获得150积分,挑战失败不得分。活动期间分数累计,达到指定分数即可领取稀有服饰“轻聆风语”。
“金雪新意”主题活动第一弹来袭 限定服饰“金灿星雪”预购进行时
11月8日起,“金雪新意”主题活动第一弹来袭,“金雪新意”限定服饰“金灿星雪”发售,预购时间为11月8日至11月10日,正式开售时间为11月11日至11月14日,玩家参与预购可享补款立减双倍。
预购阶段,玩家预付60星钻,即领全新滤镜“沉暮”及5点关注度,正式开售期间补款立减120星钻。关注度达指定要求可解锁限定服饰礼盒的不同折扣,最低可2折获取本期限定服饰。
此外,11月8日至11月14日,“新意节会场”专属折扣商店限时上架,包含全新元气少女系列动态动作首发、往期资源限时复刻及各类超低折扣礼包。元气少女系列动态动作包括:“心动百分百”、“小情绪”及“元气满格”三款全新动态动作礼包,每款礼包包含全新动作、全新贴纸背景及粉钻奖励;限时复刻&超低折扣礼包包括:“咕噜噜”动作礼包、“我生气咯”动作礼包、“承让承让”动作礼包及“锦叶闻秋礼服”礼包限时复刻;“个人改名卡”、“联盟改名卡”及“美甲店改名卡”限时超值特惠,供玩家们选购。
“绮想嘉年华”感应活动限时复刻 时尚提升计划“部落记忆”即将开启
11月8日至11月14日,感应活动“绮想嘉年华”限时复刻,限时累充福利同步开启。活动期间,玩家进行限定感应将有机会获得非凡清新套装“小丑的问好”以及对应套装的设计师之影、记忆回响。套装动作“乐园巡礼”可在完成“小丑的问好”套装及设计师之影收集后通过“成就”获取。
11月15日至22年1月16日,时尚提升计划第十三册“部落记忆”即将开启。“时尚提升计划”分为“基础计划”和“特别计划”,玩家可完成对应任务积累时尚力,获得时尚等级提升并领取相应奖励。默认解锁“基础计划”任务奖励,玩家可选择开启“特别计划”,领取专属服饰等奖励。神秘的图腾纹章被绘制于设计之中,诠释了力量和原始之美,一起提升时尚之力吧!
此外,本次更新带来更多游戏活动内容及优化升级:11月15日至11月22日,非凡感应活动“花漫晴空”限时开启,同步开启材料“限时累充福利”,“花漾之遇”新意节加码活动即将来袭……更多精彩游戏活动内容,可前往@闪耀暖暖官方微博了解,或登录《闪耀暖暖》体验。
】【伟大拉力赛 《第五人格》深渊珍宝IV震撼开启******
深渊之下,呈现伟大追逐。驽骍难得,冲破无边阴影!网易首款1V4非对称竞技手游《第五人格》“深渊的呼唤IV”现已震撼启幕,山间雪道上,玩家们已经开启了激烈的速度竞赛,异彩纷呈的追逐对决令赛道上火光四射,热血沸腾!
近日,备受期待的深渊珍宝IV也已正式上线,鹿头稀世时装“熔铁猎犬”领衔众多珍贵奖励联袂登场,即刻驶入赛场,尽享急速驰骋!
山间雪道,赛车手鸣笛就位
经过一年的等待,目睹了ZQ战队两度捧起IVL职业联赛冠军奖杯,欣赏了众多职业战队带来的酣畅竞技,你是否倍加期待巅峰对决的上演?现在,它来了!1月15日,《第五人格》深渊的呼唤IV盛典正式开启,山间雪道阶段率先开赛,截止1月28日,所有参赛战队的队员参与战斗即可获得大量盛典专属奖励,并可为所属战队赢得战斗积分,最终积分排名前一百的中国大陆赛区战队和排名前五十的非中国大陆赛区战队将获得晋级盛典小组赛阶段的资格。
1月28日维护后,盛典小组赛阶段“冻港危途”将如期开战,汇聚了各自赛区的强力战队,竞技的激烈度和观赏性将大幅提升,而仅有战斗积分排名前八的中国大陆赛区战队与八支未被直接邀请的IVL战队,以及非中国大陆赛区积分排名前八的战队方有资格参与各自赛区的线上预选赛。
2月4日起,“巅峰时速”阶段开启,赛事组将进行最终排名公示并向晋级战队发出参赛邀请,若有战队无法参加,则将顺延邀请后一名战队参赛。
中国大陆赛区线上预选赛预计将于3月份火爆开赛,16支战队里将决出6支顶级战队,代表中国大陆赛区出征COAIV全球总决赛。在总决赛中,8支中国大陆赛区战队将与3支日本赛区战队、2支东南亚赛区战队、1支欧美赛区战队、1支港澳台赛区战队和1支韩国赛区战队同台竞技,角逐代表《第五人格》至高荣耀的深渊奖杯和300万元总奖金!
狩猎开始,赛道上无处可逃
作为庄园内最老牌的监管者角色之一,鹿头在本届COA上迎来了属于自己的“高光时刻”——稀世时装“熔铁猎犬”和奇珍随身物品“卡住的齿轮”同步上线,在深渊珍宝IV中等待玩家们的抽取!
鹿头-熔铁猎犬的身躯由金属薄片构筑而成,体内熊熊燃烧的烈焰不断散发着炙热的能量,迫不及待想挣脱所有的束缚,令它的躯体在力量的逼近巅峰时也临近了崩坏的边缘。
卡住的齿轮则是三个相互啮合的齿轮构成的器械,艰难转动的同时还不断闪出火星。
《第五人格》还发布了鹿头稀世时装熔铁猎犬和奇珍随身物品卡住的齿轮的内录视频,供玩家们更直观地查看时装和随身物品的特色。在角色展示界面,鹿头-熔铁猎犬用锁链张狂地拉动赛车,其驱车飞驰的气势碾压一切。
协力对抗,拉力赛胜负未知
尽管鹿头-熔铁猎犬为所有参赛者带来了巨大的压力,但勇敢的赛车手绝不会轻言放弃,只要团结协作,伟大拉力赛的胜负归属依然是个悬念。
勘探员-公路骑士身着棕色皮衣和水泥灰布丁牛仔裤,头盔上的扇叶被触手紧紧缠住无法动弹,脸上隐约可见轮胎碾过的痕迹。历经缠斗和失败的苦痛,他却一直没有放弃执念——必须要用车手最纯粹的赢得比赛!
祭司-反光镜以飒爽摩托车手的形象登场。衣着上散布镜面让她在骑行过程中可以发掘赛道的一切秘密,但这能真正帮助她占据比赛的优势么?
杂技演员-气胎满是玩世不恭的表情。头上的破旧轮胎和随身携带的充气泵,体现着他戏谑的个性和有趣的想法。但他心中真正的决心又有谁能的理解?
调酒师-助燃剂是一位痴迷引擎的机车狂热者。她的工作服被随性地扎于腰间,油污满身也毫不在意。手上的助燃剂则是其得意的发明——虽然偶尔会有点小小意外。
《第五人格》也同步发布了四款奇珍时装的内录视频,尽展四位求生者在赛场上的非凡风采。
除了上述时装和随身物品外,玩家们在深渊珍宝IV中还有机会获取雕刻家独特时装“轮椅骑手”、爱哭鬼独特时装“狂热观众”、疯眼独特时装“拆卸工”、邮差独特时装“报童”和囚徒独特时装“赛车机师”及随从、涂鸦、头像框等精美好礼。总决赛期间,野人奇珍时装“零件拍档”将上架商城,它在这场比赛中又扮演了怎样的角色?敬请期待!
伟大赛事震撼开启,巅峰竞技重磅回来,山间雪道激烈追逐,深渊宝座谁能问鼎?网易首款1V4非对称竞技手游《第五人格》“深渊的呼唤IV”盛典现已火热开启,深渊珍宝IV震撼上线,这一场没有胜者,更没有幸存者的比赛里,你能否找到一线生机,打破无边的阴影?!
【关于第五人格】
《第五人格》是网易首款非对称性对抗竞技手游。荒诞哥特画风,悬疑烧脑剧情,刺激的1V4的对抗玩法,都将给玩家带来全新的游戏体验。玩家将扮演侦探奥尔菲斯,在收到一封神秘的委托信后,进入恶名昭著的庄园调查一件失踪案。在进行证据调查过程中,玩家扮演的奥尔菲斯将采用演绎法,对案情进行回顾。在案情回顾时,玩家可以选择扮演监管者或求生者,展开激烈的对抗。而在调查的过程,无限接近事实时,却发现越来越不可思议的真相。
】【刷屏的DeepSeek******
每经记者 郑雨航 每经编辑 高涵 兰素英
“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。
12月26日,深度求索官方微信公众号推文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。
公众号推文是这样描述的:DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
不过,广发证券发布的测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。
更重要的是,深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3,仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
消息一出,引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道:“DeepSeek-V3让在有限算力预算上进行模型预训练这件事变得容易。DeepSeek-V3看起来比Llama-3-405B更强,训练消耗的算力却仅为后者的1/11。”
然而,在使用过程中,《每日经济新闻》记者发现,DeepSeek-V3竟然声称自己是ChatGPT。一时间,“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。
对此,《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得改进。”
每经记者向深度求索公司发出采访请求,截至发稿,尚未收到回复。
针对DeepSeek-V3,独立评测网站Artificial Anlaysis就关键指标——包括质量、价格、性能(每秒生成的Token数以及首个Token生成时间)、上下文窗口等多方面——与其他人工智能模型进行对比,最终得出以下结论。
质量:DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。
价格:DeepSeek-V3比平均价格更便宜,每100万个Token的价格为0.48美元。其中,输入Token价格为每100万个Token 0.27美元,输出Token价格为每100万个Token1.10 美元。
速度:DeepSeek-V3比平均速度慢,其输出速度为每秒87.5个Token。
延迟:DeepSeek-V3与平均水平相比延迟更高,接收首个Token(即首字响应时间)需要1.14秒。
上下文窗口:DeepSeek-V3的上下文窗口比平均水平小,其上下文窗口为13万个Token。
最终Artificial Anlaysis得出结论:
“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型,并且击败了OpenAI的GPT-4o(8月),并接近Anthropic的Claude 3.5 Sonnet(10月)。
DeepSeek-V3的人工智能分析质量指数得分为80,领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B,DeepSeek现在是中国的AI领先者。”
12月29日广发证券计算机行业分析师发布研报称:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”
测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面,DeepSeek-V3并未展现出明显优于其他大模型之处。
除了能力,DeepSeek-V3最让业内惊讶的是它的低价格和低成本。
《每日经济新闻》记者注意到,亚马逊Claude 3.5 Sonnet模型的API价格为每百万输入tokens 3美元、输出15美元。也就是说,即便是不按照优惠价格,DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。
相对低廉的价格,得益于DeepSeek-V3的训练成本控制,深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型,花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
DeepSeek“AI界拼多多”也由此得名。
DeepSeek-V3通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。在大规模MoE模型的训练中,DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施,显著降低了训练成本,以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明,模型效果不仅依赖于算力投入,即使在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。
广发证券分析称,DeepSeek-V3算力成本降低的原因有两点。
第一,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。
第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。
科技媒体Maginative的创始人兼主编Chris McKay对此评论称,对于人工智能行业来说,DeepSeek-V3代表了一种潜在的范式转变,即大型语言模型的开发方式。这一成就表明,通过巧妙的工程和高效的训练方法,可能无需以前认为必需的庞大计算资源,就能实现人工智能的前沿能力。
他还表示,DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小,公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和价值主张。
不过,广发证券分析师认为,算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后,有望驱动相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中,推理过程涉及到对大量实时数据的快速处理和决策,仍然需要强大的算力支持。
在DeepSeek-V3刷屏之际,有一个bug也引发热议。
在试用DeepSeek-V3过程中,《每日经济新闻》记者在对话框中询问“你是什么模型”时,它给出了一个令人诧异的回答:“我是一个名为ChatGPT的AI语言模型,由OpenAl开发。”此外,它还补充说明,该模型是“基于GPT-4架构”。
国内外很多用户也都反映了这一现象。而且,12月27日,Sam Altman发了一个帖文,外媒指出,Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。
于是,有人就开始质疑:DeepSeek-V3是否是在ChatGPT的输出基础上训练的?为此,《每日经济新闻》向深度求索发出采访请求。截至发稿,尚未收到回复。
针对这种情况产生的原因,每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示,他对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得了改进。”
TechCrunch则猜测称,深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的,那么该模型可能已经记住了GPT-4的一些输出,现在正在逐字反刍它们。”
“显然,该模型(DeepSeek-V3)可能在某些时候看到了ChatGPT的原始反应,但目前尚不清楚从哪里看到的,”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出,“这也可能是个‘意外’。”他进一步解释称,根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响,因为它可能导致幻觉和误导性答案。
不过,DeepSeek-V3也并非是第一个错误识别自己的模型,谷歌的Gemini等有时也会声称是竞争模型。例如,Gemini在普通话提示下称自己是百度的文心一言聊天机器人。
造成这种情况的原因可能在于,AI公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计,到2026年,90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。
“互联网数据现在充斥着AI输出,”非营利组织AI Now Institute的首席AI科学家Khlaaf表示,基于此,如果DeepSeek部分使用了OpenAI模型进行提炼数据,也不足为奇。
】【刷屏的DeepSeek******
每经记者 郑雨航 每经编辑 高涵 兰素英
“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。
12月26日,深度求索官方微信公众号推文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。
公众号推文是这样描述的:DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
不过,广发证券发布的测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。
更重要的是,深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3,仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
消息一出,引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道:“DeepSeek-V3让在有限算力预算上进行模型预训练这件事变得容易。DeepSeek-V3看起来比Llama-3-405B更强,训练消耗的算力却仅为后者的1/11。”
然而,在使用过程中,《每日经济新闻》记者发现,DeepSeek-V3竟然声称自己是ChatGPT。一时间,“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。
对此,《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得改进。”
每经记者向深度求索公司发出采访请求,截至发稿,尚未收到回复。
针对DeepSeek-V3,独立评测网站Artificial Anlaysis就关键指标——包括质量、价格、性能(每秒生成的Token数以及首个Token生成时间)、上下文窗口等多方面——与其他人工智能模型进行对比,最终得出以下结论。
质量:DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。
价格:DeepSeek-V3比平均价格更便宜,每100万个Token的价格为0.48美元。其中,输入Token价格为每100万个Token 0.27美元,输出Token价格为每100万个Token1.10 美元。
速度:DeepSeek-V3比平均速度慢,其输出速度为每秒87.5个Token。
延迟:DeepSeek-V3与平均水平相比延迟更高,接收首个Token(即首字响应时间)需要1.14秒。
上下文窗口:DeepSeek-V3的上下文窗口比平均水平小,其上下文窗口为13万个Token。
最终Artificial Anlaysis得出结论:
“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型,并且击败了OpenAI的GPT-4o(8月),并接近Anthropic的Claude 3.5 Sonnet(10月)。
DeepSeek-V3的人工智能分析质量指数得分为80,领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B,DeepSeek现在是中国的AI领先者。”
12月29日广发证券计算机行业分析师发布研报称:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”
测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面,DeepSeek-V3并未展现出明显优于其他大模型之处。
除了能力,DeepSeek-V3最让业内惊讶的是它的低价格和低成本。
《每日经济新闻》记者注意到,亚马逊Claude 3.5 Sonnet模型的API价格为每百万输入tokens 3美元、输出15美元。也就是说,即便是不按照优惠价格,DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。
相对低廉的价格,得益于DeepSeek-V3的训练成本控制,深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型,花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
DeepSeek“AI界拼多多”也由此得名。
DeepSeek-V3通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。在大规模MoE模型的训练中,DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施,显著降低了训练成本,以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明,模型效果不仅依赖于算力投入,即使在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。
广发证券分析称,DeepSeek-V3算力成本降低的原因有两点。
第一,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。
第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。
科技媒体Maginative的创始人兼主编Chris McKay对此评论称,对于人工智能行业来说,DeepSeek-V3代表了一种潜在的范式转变,即大型语言模型的开发方式。这一成就表明,通过巧妙的工程和高效的训练方法,可能无需以前认为必需的庞大计算资源,就能实现人工智能的前沿能力。
他还表示,DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小,公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和价值主张。
不过,广发证券分析师认为,算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后,有望驱动相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中,推理过程涉及到对大量实时数据的快速处理和决策,仍然需要强大的算力支持。
在DeepSeek-V3刷屏之际,有一个bug也引发热议。
在试用DeepSeek-V3过程中,《每日经济新闻》记者在对话框中询问“你是什么模型”时,它给出了一个令人诧异的回答:“我是一个名为ChatGPT的AI语言模型,由OpenAl开发。”此外,它还补充说明,该模型是“基于GPT-4架构”。
国内外很多用户也都反映了这一现象。而且,12月27日,Sam Altman发了一个帖文,外媒指出,Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。
于是,有人就开始质疑:DeepSeek-V3是否是在ChatGPT的输出基础上训练的?为此,《每日经济新闻》向深度求索发出采访请求。截至发稿,尚未收到回复。
针对这种情况产生的原因,每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示,他对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得了改进。”
TechCrunch则猜测称,深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的,那么该模型可能已经记住了GPT-4的一些输出,现在正在逐字反刍它们。”
“显然,该模型(DeepSeek-V3)可能在某些时候看到了ChatGPT的原始反应,但目前尚不清楚从哪里看到的,”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出,“这也可能是个‘意外’。”他进一步解释称,根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响,因为它可能导致幻觉和误导性答案。
不过,DeepSeek-V3也并非是第一个错误识别自己的模型,谷歌的Gemini等有时也会声称是竞争模型。例如,Gemini在普通话提示下称自己是百度的文心一言聊天机器人。
造成这种情况的原因可能在于,AI公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计,到2026年,90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。
“互联网数据现在充斥着AI输出,”非营利组织AI Now Institute的首席AI科学家Khlaaf表示,基于此,如果DeepSeek部分使用了OpenAI模型进行提炼数据,也不足为奇。
】【北方多地将度过下半年来最冷白天******
北方多地将度过下半年来最冷白天 明起中东部开启升温模式
中国天气网讯 今后三天(12月27日至29日),全国大部继续维持晴朗干燥的天气格局,西藏、青海南部有一次降雪过程,并伴有大风天气。眼下,冷空气对中东部的影响还在持续,长江以北部分地区气温或创今年下半年来新低,明天起大江南北将陆续迎来升温。
全国大部晴朗天气居多 西藏青海降雪发展
近期,全国大部降水稀少,多地午后最小相对湿度不足30%,广西、广东、福建一带出现中度以上气象干旱。今后三天,全国大部晴朗天气依然唱主调,随着南支槽东移,西藏、青海南部将自西向东有一次降雪过程,降雪期间,西藏的阿里、那曲和日喀则大部还将出现7至8级大风,阵风可达9至10级。
中央气象台预计,今天,西藏西部、新疆西南部、川西高原东部、贵州西部、内蒙古东北部等地部分地区有小雪或雨夹雪,其中,西藏西部部分地区有中到大雪,局地暴雪。湖北西南部、四川盆地南部、重庆中部、贵州东北部和西部、云南东部、广西西北部、海南岛中东部、台湾岛等地部分地区有小雨。
明天,新疆北疆北部和南疆盆地南部山区、西藏西北部和南部、青海南部和西部等地部分地区有小到中雪,其中,西藏南部和西部等地部分地区有大到暴雪。云南西南部和中部、台湾岛东部等地部分地区有小雨。
后天,内蒙古东北部、西藏北部和东部、青海南部和西部、甘肃南部、川西高原北部等地部分地区有小雪或雨夹雪,其中,西藏东部、青海南部、甘肃南部、川西高原北部等地部分地区有中到大雪,西藏东部等地局地暴雪。西藏东南部、四川盆地东南部、重庆中西部、贵州西北部、台湾岛东部等地部分地区有小雨。
中国天气网提醒,这次降雪过程可能给西藏南部部分地区带来5至10厘米的新增积雪,局地可达30厘米以上,公众需注意防范积雪、风吹雪、大风等对交通出行、农牧业等方面的不利影响。此外,中东部干燥天气持续,且随着干冷的偏北风南下控场,华北、黄淮等地干燥程度还会加剧,江南、华南多地湿度也会随之下降,大家需及时补充水分,多吃银耳、雪梨等食物缓解干燥。
今天中东部多地气温继续下降 明起陆续迎来升温
今天,冷空气继续南下,中东部多地将出现降温,气温将短暂转为较常年同期偏低的状态,长江以北部分地区还可能度过下半年来最冷的白天。城市中,兰州今天最高气温零下3℃,可能创下半年来气温新低。
明天起,北方大部将开启升温模式,南方则在后天步入升温通道。2024年尾声,全国大部气温将较常年同期偏高,其中华北至华南北部气温普遍会偏高5℃左右。总体来看,未来几天晴朗升温是“主旋律”,大家不妨在中午时段适当进行户外活动。
来源:中国天气网
】崇沙羽 | 2025-01-10 |
每个人都有自己特有的特点,描写的特别分明,让观众可以感受到艰难的处境,也对之后的发展有所期待,更有观赏性。 |
所绮彤 | 2025-01-10 |
牛仔裤收到了,非常满意,款式做工,线头处理的都不错,上身效果也好 |
镜昊英 | 2025-01-10 |
所在区服: |
索颂 | 2025-01-10 |
家园 |
嬴皓洁 | 2025-01-10 |
都说 一顿不吃 饿得慌 两个大饭桶 得吃多少哪来的状态 难道是喝西北风充饥,这导员也真的是个奇葩 |
党令梅 | 2025-01-10 |
看着2013年14年甚至12年的评论,时间过得真快,往事历历在目 |
系英媛 | 2025-01-10 |
终于上映了 演员还是那么熟悉 都是老演员 还有于文文 于文文演的电影以及电视剧都很不错的 于文文未来可期。 |
仝新梅 | 2025-01-10 |
流川枫 : 磕金修仙,捡拉几清背包的生活 |
凌理全 | 2025-01-10 |
除了男主,两个徒弟和师妹以及师妹徒弟都是来恶心人的吧,故事虽然不算精彩,但是这几个所谓主角就扣一半分,这又不是什么流量大电影,找几个不尴尬的不好吗,五分给谢九, |
端采萱 | 2025-01-10 |
唯一觉得瑕疵的是 宇宙的消息?其实翻译成老天的旨意 不会更符合情境嘛 哈哈哈 |