正规实盘杠杆平台排行
正规杠杆平台排行
  • 常州期货配资 马斯克发布类GPT-4级别模型,能解9.8和9.11哪个大

    常州期货配资 马斯克发布类GPT-4级别模型,能解9.8和9.11哪个大

    相关三方机构提供的数据显示常州期货配资,截至12月23日,监测的国内7885只股票策略私募产品最新净值公布,共计有26只产品在年内实现了超过200%的收益率。冲击今年国内股票策略私募产品前十名的收益率门槛高达290.72%。前三名今年以来的收益率分别为738.33%、522.42%和473.49%。

    第三方机构统计监测数据显示,截至12月23日,7885只股票策略私募产品中,26只年内实现了超过200%的收益率,收益率超过100%的产品数量则达到176只。而今年国内股票私募产品前十名榜单的收益率门槛高达290.72%。前三名年内收益率分别高达738.33%、522.42%和473.49%。

    今年的冠军私募来自于广东深圳,核心基金经理陈某,此前具有券商交易部和职业操盘从业经历,证券从业经历16年。从排名前十位的私募机构所在地域来看,公司位于广东的私募机构占据了半壁江山,合计数量达到6家。而所在地区位于北京、上海两大私募重镇的私募机构中,2020年产品业绩排名最高的为上海的一家私募,该机构旗下某产品2020年以来累计收益279.62%,排名第十一位。

    马斯克旗下 xAI 大模型 Grok 2 正式发布。

    本次发布的 Grok 2 系列主要包括两个版本:Grok-2 和 Grok-2 mini。简单总结一下这两款模型:

    Grok-2:大而全,类 GPT-4 级别模型,处于大模型的中上游水准

    Grok-2 mini:小而美,响应速度快,但回复的质量不及 Grok-2

    xAI 公司宣称,当下推出的预览版 Grok-2 在聊天、编程和推理方面均有着不俗的表现。Grok-2 系列模型将陆续集成到 X 平台,并且也将在 8 月底通过企业 API 向客户提供。

    图片

    类 GPT-4 级别模型迎来新玩家,Grok 2 登场

    老规矩,先说结论,虽说马斯克和 Altman 的唇枪舌战中常常处于上风,但早期预览版的 Grok-2 没能上演逆袭 ChatGPT 的大戏。

    在公认比较靠谱的大模型竞技场 LMSYS 排行榜上,它的得分表现压过了 GPT-4o mini 和 Claude 3.5 Sonnet 一头。

    而排在它前面的分别有「宿敌」OpenAI 的 GPT-4o-2024-05-13、Gemini-1.5-Pro-Exp-0801 以及 GPT-4o-latest-2024-08-08 等模型。

    在大模型竞技场与其他模型的较量中,Grok-2 遇上 Gemini 1.5 Pro 的胜率最低,只有 48%,其次分别为 GPT-4o(05-13)以及 GPT-4o mini(07-18)等一众模型。

    据介绍,在内部评估里,xAI 重点评估模型在两个关键方面的能力,其一为遵循指令,其二是提供准确、真实的信息。

    其中 xAI 会采用一种模拟测试的方法:

    AI 导师与模型在各种任务中进行互动,这些任务模拟了与 Grok 的真实互动场景。

    在每次互动中,AI 导师会根据我们制定的评估标准,从 Grok 生成的两个回应中选择出更佳的一个。

    结果表明,相比 Grok-2 mini 以及 Grok-1.5,Grok-2 在处理检索到的内容时的推理能力,以及在使用工具方面的能力,如正确识别缺失信息、通过事件序列进行推理以及排除无关内容等方面,都有了显著的进步。

    从基准测试结果来看,Grok-2 的水准基本上能够碾压 GPT-4 Turbo 以及 Claude 3 Opus,甚至在表现上也能与 GPT-4o 以及 Llama 3-405B 互有胜负。

    不过,xAI 所披露的基准测试结果也有点「小心思」,比如虽说能和 GPT-4o 不分伯仲,但是用的却是 GPT-4o 以及 GPT-4 Turbo 5 月份的得分,所以很难不让人怀疑这是为了美化结果所打的时间差。

    xAI 团队成员 Guodong Zhang 则发文称:

    有趣的是,与我们大多数其他公司和实验室不同,我们的发展速度非常快,以至于我们一直没有时间为每个模型发布编写正式的技术报告。

    此外,xAI 还特地指出,Grok-2 在大规模多任务语言理解基准测试 MMLU 中,使用的是没有经过特定任务训练的 Grok-2,更真实地反映了该模型的泛化能力和对新任务的适应性。简言之,哥们菜归菜,但胜在真实。

    9.8 大还是 9.11 大?Grok-2 竟然知道答案

    去年底,马斯克宣布 Grok 将被集成到 X 平台上,并同期向 X 平台的 Premium+ 订阅用户开放,然而,除了可以实时访问 X 的信息,体验过后的网友几乎都给 Grok 打了差评。

    现在,Grok-2 和 Grok-2 mini 都将逐步集成到 X 平台上,X Premium 和 Premium+ 用户均可体验这两款新模型。

    官方说了,Grok-2 具备文本和视觉理解能力,能实时整合 X 平台的信息。Grok-2 mini 则主打小巧精致,在速度和答案质量之间实现了平衡。

    但既然 Grok-2 系列都要集成到 X 上了,总归要给付费的订阅用户拿出一些新东西。

    与前代相比,Grok-2 的最大变化莫过于能直接生成图片了。据 xAI 团队内部成员透露,生图的模型正是用到了近期大火的 FLUX.1 模型。

    获得访问权限的 X 网友 @ai_for_success 也分享了新版 Grok 的用户使用界面。嗯,看起来有种 AI 搜索的即视感。

    玩梗的网友让 Grok 生成一幅「Llama(骆驼)吃草莓」的图,效果也相当不错。

    新版 Grok 的自由度更高,特朗普前脚刚直播完,今天 X 平台就铺满了由 Grok 生成的照片,甚至还能生成略微裸露的图片。

    网友发现,Grok-2 在图片生成次数方面存在限制,Premium 用户预计能够生成约 20 - 30 张图像,而 Premium+ 用户能够生成更多。

    由 Grok-2 mini 生成的图片搭配 Luma Dream Machine 制作而成的钢铁侠视频,感觉如何?

    Thumbplayer Poster Plugin Image

    「9.8 和 9.11 哪个大」的经典难题也没难倒 Grok-2。

    甚至也能数清草莓(strawberry)里有多少个「r」的难题。

    激动不已的马斯克接连转发了数条有关 Grok 2 的推文,为其大力站台宣传,并盛赞 xAI 团队进展速度非常出色。

    不看广告,看疗效,Grok-2 更像是一款意义大于实际的新模型,它的发布意味着整个 AI 行业开始迎来了新的类 GPT-4 级别模型,但或许并没有带来足够多的惊喜。

    今年 4 月,马斯克在接受挪威主权基金负责人 Nicolai Tangen 采访时表示,Grok-2 需要大约 2 万张 H100 来进行训练。

    而上个月在给 Grok-2 的预热期间,马斯克也透露 Grok-3 用了 10 万块英伟达 H100 芯片进行训练,预计将于年底发布,届时将有望成为最强的 AI 大模型。

    为此,马斯克甚至不惜调用特斯拉的芯片来给 xAI 团队加 Buff,以至于惹得特斯拉投资者纷纷不满。

    值得一提的是,在最近的 X Space 活动上,马斯克依然对 AI 的未来充满信心,他预测到明年年底, AI 可能比任何人类都聪明。

    而我的建议是常州期货配资,要不还是先等等 Grok 3 的的效果如何吧。