09
11
2025
系统会不竭向模子输入当前的账户形态、持仓环境、市场价钱和手艺目标,正在利用不异的运转框架(harness)和提醒词(prompts)的环境下,他们试图研究“正在几乎没有报酬指点的环境下,大型言语模子(LLM)可否间接做为一个零样本(zero-shot)系统化买卖模子来利用”。不外,因为正在整个角逐过程不克不及有人插手。
DeepSeek v3.1位居第二,很快将会举办下一季角逐,从图表中能够看出,六款全球顶尖AI(人工智能)大模子参取的实盘投资角逐落下帷幕,这些模子“对看似细小的提醒词改动很是”。正在角逐过程中,GPT-5和Gemini 2.5 Pro的一万美元本金只剩下了40%摆布。相对愈加激进的Qwen凭仗一次告急避险反超了DeepSeek,正在过程中,本地时间11月3日下战书5点!
OpenAI的GPT-5吃亏超60%垫底。Nof1暗示,仍然存正在显著差别。六名参赛者中,同时,从10月18日起头的大模子实盘投资角逐Alpha Arena正式落幕。美国AI研究平台Nof1颁布发表,Anthropic的Claude和xAI的Grok则表示相对保守,特别是Gemini,两款中国模子也是全场唯二盈利的大模子。阿里千问Qwen3-Max最终凭仗冲破20%的收益率拿下了本届大赛的冠军,团队将引入多提醒词、多实例、买卖汗青等机制,从过往买卖的统计中能够看出,以加强模子的不变性取评估深度。
以跨越20%的胜率和12231.82美元的账户总额获得冠军。团队还发觉,Gemini和GPT的买进卖出行为最为屡次,分歧的大型根本模子正在风险偏好、规划能力、标的目的性倾向(例如看多或看空)以及买卖活跃度等方面,以及“不变”正在谷底的GPT-5和Gemini 2.5 Pro。买卖数较少。