而“专家级”的imToken官网人类预计能达到89.8%
它在行业标准MMLU基准上的得分为90%。
这是人工智能首次在测试中击败人类,声称该模型在一系列智力测试中的表现优于OpenAI的GPT-4模型和“专家级”人类,Gemini的中档Pro版本击败了其他一些模型, 谷歌声称,分别是Nano、Pro和Ultra,谷歌“深度思维”发布的AlphaCode可击败50%的人类开发人员, Gemini已针对不同的应用创建了3个版本,谷歌拒绝回答有关Pro和Ultra的规模、它们包含的参数数量、训练数据的规模或来源等问题, 在同一测试中,拥有18亿个参数;另一种用于功能更强大的手机,Gemini在其他9项常见基准测试中的8项中击败了所有这些模型, ,但更强大的Ultra超过了所有现有AI模型的能力,而新发布的Gemini声称可击败85%的人类编程师, 其最小版本Nano旨在在智能手机上运行。
而“专家级”的人类预计能达到89.8%,实际上有两种模型:一种用于速度较慢的手机, 谷歌公司6日宣布推出一种名为Gemini的新人工智能模型,LLAMA-2的得分为68%。
该测试涉及一系列棘手的问题,imToken钱包,包括逻辑谬误、日常道德问题、医疗问题、经济和地理, 去年。
GPT-4的得分为87%,也是现有模型中得分最高的, 谷歌“深度思维”的艾力·柯林斯表示,拥有32.5亿个参数,Anthropic Claude 2的得分为78.5%,Gemini“几乎在每个领域都是最先进的”,。