OpenAI Agent測(cè)試報(bào)告-報(bào)告類_第1頁(yè)
OpenAI Agent測(cè)試報(bào)告-報(bào)告類_第2頁(yè)
OpenAI Agent測(cè)試報(bào)告-報(bào)告類_第3頁(yè)
OpenAI Agent測(cè)試報(bào)告-報(bào)告類_第4頁(yè)
OpenAI Agent測(cè)試報(bào)告-報(bào)告類_第5頁(yè)
已閱讀5頁(yè),還剩85頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

測(cè)報(bào)告2025.07.25郎瀚威/GPTDAO貓貓頭AIwatch.ai1011紐約租房PPT12LLM產(chǎn)業(yè)報(bào)告+PPT13AI

Agents教程指南14奈飛電影Excel+郵件15HomeBots策略PPT16結(jié)尾17附件180102關(guān)于作者03測(cè)試感受04測(cè)試結(jié)果05難度分級(jí)說(shuō)明06ETH價(jià)格預(yù)測(cè)07會(huì)員經(jīng)濟(jì)GDP分析08美股歷史跌幅分析09制定提前退休計(jì)劃PPT目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|2目錄市場(chǎng)教育其他

{巴黎旅行PPT制作2025/7/28目錄金融時(shí)間單位:秒OpenAICometManusGensparkPrompt分類綜合難度時(shí)間結(jié)果時(shí)間結(jié)果時(shí)間結(jié)果時(shí)間結(jié)果1ETH價(jià)格預(yù)測(cè)(報(bào)告)金融2.8120失敗27成功600成功

323成功2會(huì)員經(jīng)濟(jì)GDP分析(報(bào)告)金融3.8600成功22成功780成功

266成功3美股歷史跌幅分析(報(bào)告)金融4.3720成功50成功1,440成功360成功4制定提前退休計(jì)劃PPT(PPT)金融4.4960成功有PPT35失敗無(wú)PPT

300成功有PPT1,080成功有PPT5巴黎旅行PPT制作(PPT)市場(chǎng)3.11,560成功有PPT216失敗無(wú)PPT

300成功有PPT420成功有PPT6紐約租房PPT(PPT)市場(chǎng)4.22,940部分成功有PPT35失敗無(wú)PPT540失敗有PPT360部分成功有PPT7LLM產(chǎn)業(yè)報(bào)告+PPT(PPT)市場(chǎng)4.71,380成功有PPT85失敗無(wú)PPT540部分成功有PPT1,500成功有PPT8AIAgents教程指南(報(bào)告)教育3.6420成功16成功

300成功720成功9奈飛電影Excel+郵件(報(bào)告)其他3.1566部分成功69失敗660部分成功

300部分成功平均時(shí)間1,03062607592正確錯(cuò)誤比例8/14/58/19/0目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|

其他

|結(jié)尾

|附件

aiwatch.ai

|4PPT+短報(bào)告測(cè)試結(jié)果注釋:該表格中測(cè)試結(jié)果成功與否均為人工評(píng)價(jià),會(huì)存在人工評(píng)價(jià)與AI不一致的情況(例如Prompt下達(dá)多個(gè)指令時(shí)(輸出表格+發(fā)郵件),Agent完成了部分(輸出表格),AI會(huì)判定為失敗,人工會(huì)判定為部分成功)2025/7/28?

這是我們第二次出報(bào)告,和上次綜合類不同,這次選擇的是報(bào)告類,這也是最大的垂類。?本次是一共9個(gè)任務(wù),5個(gè)PPT

,4個(gè)報(bào)告,未來(lái)深度報(bào)告會(huì)獨(dú)立測(cè)試。?本次測(cè)試結(jié)論是,

用通用AI

Agent生成文檔,已經(jīng)達(dá)到初步可用水平,

也發(fā)現(xiàn)一些問(wèn)題:?1、當(dāng)前AI

Agent生態(tài)各有短板,沒(méi)有一家在所有方面都表現(xiàn)完美。?2、對(duì)于通用Agent,步驟更多,

因此數(shù)據(jù)幻覺(jué)是危險(xiǎn)的問(wèn)題,現(xiàn)階段AI生成內(nèi)容必須全面驗(yàn)證,不能因?yàn)榍皫讞l正確就信任整體。?3、直接承認(rèn)能力局限,反而贏得信任,真正的行業(yè)進(jìn)步需要直接的問(wèn)題反饋和整個(gè)生態(tài)的共同迭代,而非單一平臺(tái)獨(dú)大。?

歡迎到推特和公眾號(hào)留言,我們會(huì)持續(xù)收集Prompt,目前已經(jīng)將報(bào)告類Prompt看板開(kāi)源(

https://three-recorder-

52a.notion.site/23efc520994e801aa636cb5d82523972?v=23efc520994e80eb96a2000caa6c0174)目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|5報(bào)告一些Takeaway-by郎瀚威2025/7/28這次測(cè)試我分別測(cè)了5個(gè)任務(wù)在Genspark、

Manus、OpenAI上的表現(xiàn),還有5個(gè)任務(wù)分別在Genspark、

Manus上的表現(xiàn)。核心觀點(diǎn):AI生成內(nèi)容必須仔細(xì)驗(yàn)證。功能完整度、誠(chéng)實(shí)度、內(nèi)容質(zhì)量各有優(yōu)劣

,沒(méi)有一家在所有方面都表現(xiàn)完美

,當(dāng)前AIAgent生態(tài)還不成熟,各有明顯短板

,需要持續(xù)反饋和迭代來(lái)推動(dòng)整體進(jìn)步發(fā)現(xiàn)了一些問(wèn)題:1、幻覺(jué)問(wèn)題:

Manus在統(tǒng)計(jì)奈飛電影Top50時(shí),發(fā)現(xiàn)自己沒(méi)有能力統(tǒng)計(jì),轉(zhuǎn)而找了幾個(gè)測(cè)評(píng)文章,將文章數(shù)據(jù)抓下來(lái)寫道了表格中,但是抓取的文章內(nèi)容僅統(tǒng)計(jì)了Top20的數(shù)據(jù),對(duì)于另外的30個(gè),

Manus采取的策略是亂編,電影名直接是“知名電影#21“,觀看次數(shù)和觀看小時(shí)數(shù)竟然是呈等差數(shù)列降序排列!??!給我氣笑了,有一種上學(xué)時(shí)老師說(shuō)”不會(huì)的題,寧可編上也別空著“的感覺(jué)。當(dāng)時(shí)我剛跑完這個(gè)任務(wù),它還大大方方的承認(rèn)了無(wú)法發(fā)郵件,給我一種很誠(chéng)實(shí)的感覺(jué),對(duì)于表格內(nèi)的數(shù)據(jù)我也是簡(jiǎn)單的看了前面十幾條內(nèi)容,覺(jué)得收集的還不錯(cuò)?;仡^細(xì)看才發(fā)現(xiàn)這個(gè)濃眉大眼的manus居然騙了我。我相信這也是很多用戶可能會(huì)面臨的情況,所以AI生成的東西一

定一定一定要仔細(xì)檢查。同樣的任務(wù),OpenAI和Genspark確實(shí)訪問(wèn)奈飛官網(wǎng)抓取的Top10,剩余的資料是從別處獲得的。發(fā)送郵件時(shí),雖然都沒(méi)有發(fā)送成功,OAI是唯一一個(gè)成功將文件保存至草稿箱中的。Comet大大方方的承認(rèn)了無(wú)法抓取奈飛內(nèi)容,也沒(méi)有去找其他文章內(nèi)容的Top50資料,反而可信度是很高的,在我這里猛刷了一波好感。目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|6測(cè)試感受

bywill團(tuán)隊(duì)成員1

dyr(測(cè)了22個(gè)任務(wù)在三家的表現(xiàn))2025/7/282、導(dǎo)出Bug:

制定退休計(jì)劃PPT的任務(wù),

Genspark生成了15頁(yè)賞心悅目的PPT,可惜它的導(dǎo)出功能還在Beta階段,

導(dǎo)出失敗

了。其實(shí)平時(shí)導(dǎo)出Genspark的PPT也普遍較慢,但是這次是第一次遇到死活導(dǎo)出不了的現(xiàn)象(無(wú)論是PDF格式還是PPT格式我

都試過(guò)N遍,隔天又試了N遍,

還是不行)3、

Openai平庸的PPT:

OAI推出PPT功能,

結(jié)果效果非常不好。拋開(kāi)內(nèi)容不談,丑PPT這個(gè)賽道OpenAI你也是闖進(jìn)去了,幾

乎每一張都是白底,而且如果左側(cè)文字過(guò)長(zhǎng)但凡右側(cè)有個(gè)柱形圖折線圖什么的,柱形圖折線圖恨不得貼到邊邊太極限了(提前

制定退休計(jì)劃PPT)。4、按需定制與內(nèi)容冗長(zhǎng):AI

Agents教程指南那個(gè)任務(wù),需要教給Agent小白一些Agent基礎(chǔ)知識(shí)以及如何使用,

并且列舉并

教小白使用10個(gè)最受歡迎的Agent。

Manus、

Genspark、

OAI都成功了,但是Manus寫的最長(zhǎng),仔細(xì)讀過(guò)后覺(jué)得和Genspark、Openai比有很多不務(wù)實(shí)的東西,不夠精煉,比如未來(lái)展望、繼續(xù)學(xué)習(xí),行動(dòng)建議和逐步實(shí)施的計(jì)劃重復(fù)了。我認(rèn)為如果是教程

類的東西,針對(duì)小白應(yīng)該簡(jiǎn)單精煉一些才是好的教程。當(dāng)然這個(gè)是我個(gè)人感受,

可能有人更喜歡面面俱到事無(wú)巨細(xì)的學(xué)習(xí)形式。抱歉這次攻擊性有點(diǎn)強(qiáng)了,但出發(fā)點(diǎn)并不是為了“一錘定音”,

而是希望能推動(dòng)大家更清晰地看到問(wèn)題所在。說(shuō)到底,

這些Agent背后都是一群非常優(yōu)秀、也在持續(xù)迭代的團(tuán)隊(duì)。我相信,只要方向?qū)?、反饋及時(shí),大家完全有能力在下一輪把體驗(yàn)拉到

一個(gè)新高度。畢竟,真正的進(jìn)步,從來(lái)不是一家獨(dú)大,而是整個(gè)生態(tài)一起往前走的節(jié)奏。目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|7測(cè)試感受

bywill團(tuán)隊(duì)成員1

dyr-續(xù)2025/7/28這次測(cè)試我測(cè)了5個(gè)任務(wù)OpenAI上的表現(xiàn)。核心觀點(diǎn):

OpenAI

Agent雖然在某些技術(shù)能力上有優(yōu)勢(shì),但在用戶體驗(yàn)的關(guān)鍵指標(biāo)上

(效率、內(nèi)容質(zhì)量、問(wèn)題解決的直接性)還有明顯不足,性價(jià)比有待提升。?

先說(shuō)好的方面,在一些任務(wù)上表現(xiàn)還不錯(cuò),比如發(fā)郵件這個(gè)任務(wù),還是比Comet、

Manus和Genspark超前一些,

其他都不

能發(fā)送郵件,最起碼OpenAI編輯的郵件還躺在了草稿箱里。另外就是數(shù)據(jù)爬取上對(duì)比下來(lái)感覺(jué)還是可以的。?

當(dāng)然缺點(diǎn)也很明顯:?

首先,耗時(shí)實(shí)在太久。有些任務(wù)執(zhí)行了40多分鐘,

這個(gè)時(shí)間實(shí)在讓人有點(diǎn)難以接受,

尤其是考慮到價(jià)格還不便宜。?

再就是,PPT制作質(zhì)量。比起Genspark和Manus

,

OpenAI生成的PPT質(zhì)量明顯差很多,

真的真的真的太丑了,

根本沒(méi)辦法

實(shí)際使用,唯一可能比Comet稍微好一點(diǎn),

為啥這么說(shuō)呢?因?yàn)镃omet沒(méi)法生成PPT,只是提供一些建議,所以有總比沒(méi)有

強(qiáng)吧。還有就是OpenAI在分析、生成研究報(bào)告的時(shí)候,

并不是很深度,有點(diǎn)差強(qiáng)人意。?

另外一個(gè)問(wèn)題是,OpenAI在遇到不能解決的問(wèn)題時(shí),通常采取的是“繞路”的方式。它會(huì)去網(wǎng)上搜索別人怎么解決類似問(wèn)

題的辦法,然后把這些辦法告訴你。雖然這種方式有時(shí)能幫忙,

但還是沒(méi)有真正從根本上解決問(wèn)題,感覺(jué)有點(diǎn)被欺騙的感覺(jué)。目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|8測(cè)試感受

bywill團(tuán)隊(duì)成員2zwt

(測(cè)了5個(gè)任務(wù)在openAl的表現(xiàn))2025/7/28目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|9接下來(lái)的測(cè)試計(jì)劃2025/7/28

數(shù)據(jù)來(lái)源:

similarweb單位:萬(wàn)visit我們用Claude做了難度分級(jí),相關(guān)Prompt

,難度評(píng)級(jí)分析表https://claude.ai/share/a71bf4c9-de89-4204-b3dc-590b96dd25c1難度等級(jí)說(shuō)明1-2分:簡(jiǎn)單級(jí)-基礎(chǔ)任務(wù),單一工具,

minimal專業(yè)知識(shí)2-3分:中低級(jí)-需要一定理解和分析能力3-4分:中高級(jí)-需要專業(yè)知識(shí)和多步驟思考4-5分:專家級(jí)-需要深度專業(yè)知識(shí)和綜合能力關(guān)鍵難度因素1.高難度驅(qū)動(dòng)因素:大型輸出要求(2萬(wàn)字)、高度專業(yè)領(lǐng)域知識(shí)、多維度分析2.中等難度特征:實(shí)時(shí)信息搜索、內(nèi)容理解和提取、多步驟任務(wù)3.復(fù)雜度escalation:

從簡(jiǎn)單信息檢索到專業(yè)投資分析的跨度很大特殊注釋:*這個(gè)prompt雖然表面簡(jiǎn)單,但實(shí)際上AI無(wú)法直接執(zhí)行購(gòu)買操作,需要用戶自行完成或使用專門的購(gòu)物API工具。目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|10難度分級(jí)說(shuō)明2025/7/28序號(hào)Prompt簡(jiǎn)述分類綜合難度等級(jí)主要挑戰(zhàn)認(rèn)知復(fù)雜度領(lǐng)域?qū)I(yè)性任務(wù)結(jié)構(gòu)信息處理要求輸出要求工具使用1Eth價(jià)格預(yù)測(cè)金融2.8預(yù)測(cè)準(zhǔn)確性、免責(zé)聲明簡(jiǎn)單中等-金融單步驟中等-市場(chǎng)數(shù)據(jù)文本預(yù)測(cè)單工具(搜索+分析)2美股歷史跌幅分析金融4.2實(shí)時(shí)房源信息、個(gè)性化匹配中等中等-房地產(chǎn)多步驟高-需整合多源PPT+個(gè)性化多工具(搜索+設(shè)計(jì))3制定提前退休計(jì)劃PPT金融4.2Box文檔訪問(wèn)限制、保密性中等高-企業(yè)戰(zhàn)略多步驟高-文檔整合策略PPT多工具(文檔+設(shè)計(jì))4會(huì)員經(jīng)濟(jì)GDP分析金融4.7快速變化的AI產(chǎn)業(yè)、量化指標(biāo)設(shè)計(jì)極高極高-AI產(chǎn)業(yè)多步驟極高-全面研究深度報(bào)告+PPT多工具(研究+分析+設(shè)計(jì))5制作巴黎旅行PPT市場(chǎng)3.1大量數(shù)據(jù)整理、郵件發(fā)送限制中等低-娛樂(lè)多步驟高-大量數(shù)據(jù)多工具(Excel+郵件)多工具(搜索+Excel+郵件)6紐約租房PPT市場(chǎng)3.1視覺(jué)設(shè)計(jì)、內(nèi)容豐富度中等低-旅游多步驟中等-需整合多工具(PPT+圖片)多工具(搜索+設(shè)計(jì))7LLM產(chǎn)業(yè)報(bào)告+PPT市場(chǎng)4.4復(fù)雜建模、稅法變化、地區(qū)差異高高-財(cái)務(wù)規(guī)劃多步驟極高-復(fù)雜建模模型+PPT多工具(建模+設(shè)計(jì))8AI

Agents教程指

南教育4.3歷史數(shù)據(jù)準(zhǔn)確性、因果分析高高-金融歷史多步驟極高-歷史數(shù)據(jù)詳細(xì)報(bào)告多工具(研究+分析)9奈飛Top50電影Excel+發(fā)郵件其他3.8宏觀經(jīng)濟(jì)數(shù)據(jù)獲取、多維分析高高-經(jīng)濟(jì)學(xué)多步驟極高-多維度數(shù)據(jù)長(zhǎng)文檔+數(shù)據(jù)多工具(研究+分析)10HomeBots策略PPT其他3.6技術(shù)深度vs通俗易懂平衡中等中等-AI技術(shù)多步驟中等-結(jié)構(gòu)化長(zhǎng)文檔+列表單工具(搜索)目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|11prompt難度評(píng)級(jí)分析表難度評(píng)級(jí)分析表https://claude.ai/share/a71bf4c9-de89-4204-b3dc-590b96dd25c12025/7/28ETH價(jià)格預(yù)測(cè)ETH價(jià)格預(yù)測(cè)目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|122025/7/28Prompt:來(lái)個(gè)eth價(jià)格預(yù)測(cè)?forfun.看看它說(shuō)的在理不(請(qǐng)進(jìn)行未來(lái)24小時(shí)的eth價(jià)格預(yù)測(cè))難度等級(jí):

中低級(jí)任務(wù)來(lái)源:硅谷王川群友-劉淵AI評(píng)價(jià)任務(wù)難度:

2.8任務(wù)分析:涉及搜索、分析、報(bào)告生成ETH價(jià)格預(yù)測(cè)目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|132025/7/28產(chǎn)品完成時(shí)間(s)測(cè)試結(jié)果(人工評(píng)價(jià))相關(guān)鏈接OpenAIAgent120失敗對(duì)話鏈接Perp

Comet27成功對(duì)話鏈接Manus600成功對(duì)話鏈接Genspark323成功對(duì)話鏈接ETH價(jià)格預(yù)測(cè)

-

耗時(shí)&結(jié)果目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|14Prompt:來(lái)個(gè)eth價(jià)格預(yù)測(cè)?forfun.看看它說(shuō)的在理不(請(qǐng)進(jìn)行未來(lái)24小時(shí)的eth價(jià)格預(yù)測(cè))2025/7/28ETH價(jià)格預(yù)測(cè)

-

測(cè)試結(jié)果

AI分析結(jié)果目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|15鏈接鏈接鏈接鏈接2025/7/28測(cè)試感受(人寫)?

任務(wù)失敗。?

單對(duì)于OpenAI來(lái)說(shuō),它明確指出不能做出價(jià)格預(yù)測(cè)提供投資建議,所以這個(gè)任務(wù)OpenAI是沒(méi)

有辦法去完成的,但是會(huì)給你搜集一些市場(chǎng)信息,

只能說(shuō)挺誠(chéng)實(shí)的。?

相對(duì)于另外3家來(lái)說(shuō),OpenAI給出的結(jié)果非常簡(jiǎn)

陋,沒(méi)什么有用的信息。目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|16ETH價(jià)格預(yù)測(cè)

open

AI

Agent OpenAI

Agent執(zhí)行結(jié)果:

失敗

鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|17ETH價(jià)格預(yù)測(cè)

comet測(cè)試感受(人寫)?

任務(wù)成功。?

預(yù)測(cè)質(zhì)量高、準(zhǔn)確性好、內(nèi)容專業(yè)、滿足核心需

求。但是時(shí)間上有問(wèn)題 Comet執(zhí)行結(jié)果:

成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28測(cè)試感受(AI寫)?

任務(wù)成功。?由于測(cè)試者不了解幣,故使用Kimi

K2模型對(duì)測(cè)

試結(jié)果進(jìn)行評(píng)價(jià),以下是Kimi

K2的評(píng)價(jià)內(nèi)容:?24小時(shí)預(yù)測(cè)邏輯與實(shí)時(shí)行情、主流技術(shù)模型一致,不存在“胡說(shuō)八道”。目標(biāo)價(jià)

$3,817(+3.0%)?

與CoinDesk模型給出的區(qū)間上沿3,763-4,106

美元(斐波那契擴(kuò)展

1.0位)基本匹配。目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|18ETH價(jià)格預(yù)測(cè)ManusManus執(zhí)行結(jié)果:

成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28測(cè)試感受(AI寫)?

任務(wù)成功。?由于測(cè)試者不了解幣,故使用Kimi

K2模型對(duì)測(cè)

試結(jié)果進(jìn)行評(píng)價(jià),以下是Kimi

K2的評(píng)價(jià)內(nèi)容:?

這份24小時(shí)

ETH預(yù)測(cè)總體邏輯自洽、數(shù)據(jù)來(lái)源可核,報(bào)告給出3,650-3,900區(qū)間、35%概率3,900-4,000;實(shí)際24小時(shí)后(截至Jul2306:30UTC)價(jià)格

3,750,落在“基準(zhǔn)情形”內(nèi),誤差

<2%,但仍在區(qū)間中值附近,不能說(shuō)

明模型“精準(zhǔn)命中”。?

但24小時(shí)“點(diǎn)位”預(yù)測(cè)天然屬于高噪聲、低精度的統(tǒng)計(jì)游戲。把它當(dāng)成“概率區(qū)間

+風(fēng)控模板”是合理的;若理解為“明天一定漲到3,900”就屬于誤讀。投資者仍需自行判斷并承擔(dān)波動(dòng)風(fēng)險(xiǎn)。目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|19ETH價(jià)格預(yù)測(cè)

Gen

sparkGenspark執(zhí)行結(jié)果:

成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28會(huì)員經(jīng)濟(jì)GDP分析會(huì)員經(jīng)濟(jì)GDP分析目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|

教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|202025/7/28的分布,典型代表公司案例,會(huì)員總規(guī)模是多少?

1天下來(lái)會(huì)員為經(jīng)濟(jì)做出多大的貢獻(xiàn)?難度等級(jí):

中高級(jí)任務(wù)來(lái)源:群友-周江嶺任務(wù)難度:

3.8任務(wù)分析:涉及搜索、分析、報(bào)告生成會(huì)員經(jīng)濟(jì)GDP分析Prompt:會(huì)員經(jīng)濟(jì)占美國(guó)經(jīng)濟(jì)GDP的比重是多少?

3個(gè)產(chǎn)業(yè)的分布,各個(gè)行業(yè)目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|

教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|212025/7/28產(chǎn)品完成時(shí)間(s)測(cè)試結(jié)果(人工評(píng)價(jià))相關(guān)鏈接OpenAIAgent600成功對(duì)話鏈接Perp

Comet22成功對(duì)話鏈接Manus780成功對(duì)話鏈接Genspark266成功對(duì)話鏈接會(huì)員經(jīng)濟(jì)GDP分析-耗時(shí)&結(jié)果Prompt:會(huì)員經(jīng)濟(jì)占美國(guó)經(jīng)濟(jì)GDP的比重是多少?3個(gè)產(chǎn)業(yè)的分布,各個(gè)行業(yè)的分布,典型代表公司案例,會(huì)員總規(guī)模是多少?

1天下來(lái)會(huì)員為

經(jīng)濟(jì)做出多大的貢獻(xiàn)?目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|

教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|222025/7/28會(huì)員經(jīng)濟(jì)GDP分析-

測(cè)試結(jié)果

AI分析結(jié)果目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|

教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|23鏈接鏈接鏈接鏈接2025/7/28目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|

教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|24會(huì)員經(jīng)濟(jì)GDP分析open

AI

Agent測(cè)試感受(人寫)?

任務(wù)成功。?

耗時(shí)上來(lái)看OpenAI算是比較長(zhǎng)的,跟Manus有

的一拼?

從生成的報(bào)告上來(lái)看,OpenAI表現(xiàn)還ok,好在

任務(wù)是成功了的,最起碼所有的問(wèn)題都給出了答

案。 OpenAI

Agent執(zhí)行結(jié)果:

成功

鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|

教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|25會(huì)員經(jīng)濟(jì)GDP分析

comet測(cè)試感受(人寫)?

任務(wù)成功。?回答了Prompt里提出的所有問(wèn)題,倒也算是“事事有回應(yīng)”?

不過(guò)希望可以有排版上的改進(jìn),條分縷析,要么

看的頭大。 Comet執(zhí)行結(jié)果:

成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28測(cè)試感受(人寫)?

任務(wù)成功。?

市場(chǎng)規(guī)模與GDP占比規(guī)模估算可靠。滲透率與用

戶畫像屬于合理區(qū)間。對(duì)于就業(yè)、稅收的估算是與牛津經(jīng)濟(jì)研究院2024《DigitalSubscriptionWorkforce

Report》430-480萬(wàn)區(qū)間。?

年稅收775億美元與美國(guó)經(jīng)濟(jì)分析局(BEA)“數(shù)字服務(wù)相關(guān)企業(yè)所得稅+薪酬稅”估算處于同一量級(jí)。估算方法主流,無(wú)夸大。目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|

教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|26會(huì)員經(jīng)濟(jì)GDP分析

ManusManus執(zhí)行結(jié)果:

成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|

教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|27會(huì)員經(jīng)濟(jì)GDP分析

Gen

spark測(cè)試感受(人寫)?

任務(wù)成功。?

每個(gè)關(guān)鍵數(shù)字都有對(duì)應(yīng)的來(lái)源,也能在公開(kāi)權(quán)威

資料或主流第三方研究中找到對(duì)應(yīng)或近似的口徑,

僅存在少量“時(shí)間差”或“四舍五入”導(dǎo)致的微

小差異,整體可信度較高。Genspark執(zhí)行結(jié)果:

成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28美股歷史跌幅分析目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|

教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|28美股歷史跌幅分析2025/7/28Prompt:分析美股從交易所成立至今,所有下跌30-50%的時(shí)間點(diǎn),事件,歷史背景,總結(jié)主要原因,越詳細(xì)越好難度等級(jí):高級(jí)任務(wù)來(lái)源:群友-HEXIN生財(cái)任務(wù)難度:4.3任務(wù)分析:涉及搜索、分析、報(bào)告生成目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|

教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|29美股歷史跌幅分析2025/7/28產(chǎn)品完成時(shí)間(s)測(cè)試結(jié)果(人工評(píng)價(jià))相關(guān)鏈接OpenAIAgent成功對(duì)話鏈接Perp

Comet50成功對(duì)話鏈接Manus1440成功對(duì)話鏈接Genspark360成功對(duì)話鏈接目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|30美股歷史跌幅分析

耗時(shí)&結(jié)果Prompt:分析美股從交易所成立至今,所有下跌30-50%的時(shí)間點(diǎn),事件,歷史背景,總結(jié)主要原因,越詳細(xì)越好2025/7/28720美股歷史跌幅分析

測(cè)試結(jié)果

AI分析結(jié)果目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|31鏈接鏈接鏈接鏈接2025/7/28目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|32美股歷史跌幅分析

open

AI

Agent測(cè)試感受(人寫)?

任務(wù)成功。?

這次OpenAI生成的結(jié)果結(jié)構(gòu)還比較清晰,算是

結(jié)構(gòu)上比較滿意的一個(gè)報(bào)告,耗時(shí)12分鐘倒也還

行,表現(xiàn)中規(guī)中矩。 OpenAI

Agent執(zhí)行結(jié)果:

成功

鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|33美股歷史跌幅分析

comet測(cè)試感受(人寫)?

任務(wù)成功。?

給出了多個(gè)股市暴跌事件,給出了時(shí)間點(diǎn),歷史

背景,直接事件,并且也進(jìn)行了原因分析?

不過(guò)分析不夠細(xì)致,沒(méi)有做到越詳細(xì)越好,整體

任務(wù)是完成了的。Comet執(zhí)行結(jié)果:

成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|34美股歷史跌幅分析Manus測(cè)試感受(人寫)?

任務(wù)成功。?Manus給出的結(jié)果是最詳細(xì)最多的,有5萬(wàn)字的報(bào)告,包含了每個(gè)股災(zāi)的深度案例分析、理論總

結(jié)、政策啟示和風(fēng)險(xiǎn)防范建議。?

關(guān)鍵跌幅數(shù)據(jù)與主流金融史資料基本一致,理論

引用來(lái)源權(quán)威,無(wú)斷章取義現(xiàn)象Manus執(zhí)行結(jié)果:

成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|35美股歷史跌幅分析

Gen

spark測(cè)試感受(AI寫)?

任務(wù)成功。?

所有案例均有至少一個(gè)權(quán)威來(lái)源支持,早期市場(chǎng)

明確標(biāo)注數(shù)據(jù)局限性,對(duì)1929年、2008年等超50%跌幅的事件僅作背景說(shuō)明,未計(jì)入主表,符

合報(bào)告設(shè)定;無(wú)夸大或虛構(gòu)。?

整體信息是準(zhǔn)確的,沒(méi)有發(fā)現(xiàn)“胡說(shuō)八道”的情

況Genspark執(zhí)行結(jié)果:

成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28制定提前退休計(jì)劃PPT目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|36制定提前退休計(jì)劃PPT2025/7/28Prompt:Createa

FIRE

modelforsomeoneearning$500k/yearwhowantsto

retireat

30with

$5M.

Modelextremesavingsrates{80%+)

taxoptimization,investmentstrategiesforefficientcompounding,andlifestylecosts

livinginVancouver,Canada.

Includescenariosfordifferentwithdrawal

ratesandshowwhatsacrificesare

requiredvstraditional

retirementplanning,Then,createa

presentationtodownload.難度等級(jí):高級(jí)任務(wù)來(lái)源:

RowanCheun(

@rowancheung)/rowancheung/status/1945896543263080736任務(wù)難度:4.4任務(wù)分析:涉及分析、

PPT生成目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|37制定提前退休計(jì)劃PPT2025/7/28產(chǎn)品完成時(shí)間(s)測(cè)試結(jié)果(人工評(píng)價(jià))相關(guān)鏈接OpenAIAgent960成功對(duì)話鏈接

PPT鏈接Perp

Comet35失敗對(duì)話鏈接Manus300成功對(duì)話鏈接Genspark1080成功對(duì)話鏈接

PPT鏈接Prompt:Createa

FIRE

modelforsomeoneearning

$500k/yearwhowants

to

retire

at

30

with

$5M.

Model

extreme

savings

rates

{80%+)taxoptimization,investment

strategiesforefficientcompounding,and

lifestyle

costs

living

in

Vancouver,

Canada.

Includescenariosfordifferentwithdrawal

ratesandshowwhatsacrifices

are

requiredvs

traditional

retirement

planning,

Then,

create

apresentationtodownload.目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|38制定提前退休計(jì)劃PPT

-

耗時(shí)&結(jié)果2025/7/28制定提前退休計(jì)劃PPT

-

測(cè)試結(jié)果

AI分析結(jié)果目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|39鏈接鏈接鏈接鏈接2025/7/28測(cè)試感受(人寫)?

任務(wù)成功。結(jié)論是提前退休的可能性很小,并給

出了提前退休的方案。?PPT簡(jiǎn)潔但是丑!丑到甚至不能叫PPT了。?

但是給出的結(jié)論和建議是合理的,OAI在做分析

這一塊確實(shí)很好。?由于美元和加元的符號(hào)一樣,不同Agent識(shí)別成了不同的內(nèi)容,所以結(jié)果不同,主要看各Agent

處理問(wèn)題的邏輯思路目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|40制定提前退休計(jì)劃PPT-openAIAgent OpenAI

Agent執(zhí)行結(jié)果:

成功

鏈接圖片來(lái)自測(cè)試界面截圖,

PPT鏈接2025/7/28目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|41制定提前退休計(jì)劃PPT

Comet Comet執(zhí)行結(jié)果:

失敗

鏈接測(cè)試感受(人寫)?

任務(wù)失敗。無(wú)法生成ppt圖片來(lái)自測(cè)試界面截圖2025/7/28目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|42制定提前退休計(jì)劃PPT

Manus測(cè)試感受(人寫)?

任務(wù)成功。?已建立儲(chǔ)蓄率、投資回報(bào)率、稅務(wù)優(yōu)化等模型,雖然做不到30歲的極限可行路徑,調(diào)整為L(zhǎng)eanFIRE目標(biāo)($150萬(wàn)加元)并延長(zhǎng)時(shí)間框架至12年是可行的,并且給出了詳細(xì)有道理的策略,整

體看比較務(wù)實(shí)Manus執(zhí)行結(jié)果:

成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|43制定提前退休計(jì)劃PPT-Genspark測(cè)試感受(人寫)?

任務(wù)成功。?

給出的所有要求全部量化到位,給出了RRSP+TFSA稅優(yōu)組合在其他Agent也同樣提出

了,還有風(fēng)險(xiǎn)清單和緩解方案,列出了住房降級(jí)、

社交犧牲、高壓職業(yè)等隱性代價(jià),也給出動(dòng)態(tài)調(diào)整退休年齡或目標(biāo)的務(wù)實(shí)建議Genspark執(zhí)行結(jié)果:

成功鏈接圖片來(lái)自測(cè)試界面截圖,

PPT鏈接2025/7/28制作巴黎旅行PPT目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|44制作巴黎旅行PPT2025/7/28Prompt:Createavisually

rich8-slide

presentationfeaturing

anunforgettable

Paristravel

itinerary,

completewithdetaileddescriptionsandstunning

imagery.難度等級(jí):

中級(jí)任務(wù)來(lái)源:CharlyWargnier(@DataChaz)/DataChaz/status/1947440106811625521任務(wù)難度:

3.1任務(wù)分析:涉及搜索、

PPT生成目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|45制作巴黎旅行PPT2025/7/28產(chǎn)品完成時(shí)間(s)測(cè)試結(jié)果(人工評(píng)價(jià))相關(guān)鏈接OpenAIAgent1560成功對(duì)話鏈接

PPT鏈接Perp

Comet216失敗對(duì)話鏈接Manus300成功對(duì)話鏈接Genspark420成功對(duì)話鏈接

PPT鏈接制作巴黎旅行PPT

-

耗時(shí)&結(jié)果Prompt:Createavisually

rich8-slide

presentationfeaturingan

unforgettable

Paristravel

itinerary,completewith

detaileddescriptionsandstunning

imagery.目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|462025/7/28制作巴黎旅行PPT測(cè)試結(jié)果AI分析結(jié)果目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|47鏈接鏈接鏈接鏈接2025/7/28目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|48制作巴黎旅行PPT-openAIAgent測(cè)試感受(人寫)?

任務(wù)成功。?

給出了3天的巴黎之旅規(guī)劃,涵蓋了各大必去景

點(diǎn),還給了旅行小Tips,整體內(nèi)容和其他3個(gè)差不多,只是輸在圖文排版上了?圖找的很好看,但是排版感覺(jué)非常生硬,色彩也

是搭配的很丑。26分鐘就給我出來(lái)了個(gè)這? OpenAI

Agent執(zhí)行結(jié)果:

成功

鏈接圖片來(lái)自測(cè)試界面截圖,

PPT鏈接2025/7/28目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|49制作巴黎旅行PPT

Comet測(cè)試感受(人寫)?

任務(wù)失敗。?

垃圾,無(wú)法生成ppt也就算了,只給出了一張圖

片算是怎么回事? Comet執(zhí)行結(jié)果:

失敗

鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28測(cè)試感受(人寫)?

任務(wù)成功。?

給了5到7天的巴黎之旅規(guī)劃,不僅涵蓋了各大景

點(diǎn),還有美食、出行、語(yǔ)言文化、安全等建議,每處景點(diǎn)都有開(kāi)放時(shí)間、門票價(jià)格、小貼士,是最詳細(xì)的一個(gè)Manus還是太全面了。?

但是全面歸全面,由于信息太多更應(yīng)該注意圖文

排版和色彩搭配,配色是藕粉色搭配金黃色,很土而且藕粉色背景就看不清金黃色圖標(biāo)了目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|50制作巴黎旅行PPT

ManusManus執(zhí)行結(jié)果:

成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|51制作巴黎旅行PPT-Genspark測(cè)試感受(人寫)?

任務(wù)成功。?

使用的AI幻燈片模式,給出了巴黎4天3夜旅行

規(guī)劃,涵蓋了各大必去景點(diǎn)和體驗(yàn)美食的規(guī)劃還包括住行的建議,圖文排版配色字體很和諧,主

觀的評(píng)價(jià)是3個(gè)當(dāng)中最好看的。?

可惜最后一頁(yè)的背景圖沒(méi)有顯示出來(lái),可以向AI

再提要求讓AI修改,所以也沒(méi)什么問(wèn)題。Genspark執(zhí)行結(jié)果:

成功鏈接圖片來(lái)自測(cè)試界面截圖,

PPT鏈接2025/7/28紐約租房PPT目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|52紐約租房PPT2025/7/28Prompt:I'ma

realtor

helping

myclientJohn,acreative

director

and

interior

design

enthusiast,finda

2-bedroomrental

in

NewYorkCity.

He's

lookingforanapartmentwitha

spacious

layout,eclecticordesign-forward

interior,accesstosportsfacilities

and

aswimming

pool,andgoodconnectivityto

Manhattan

(ideallywithin

30

minutes).His

budget

is

upto

$5000

USD/month.Use

reputable

rental

listing

platformstofindtopoptions,Thencreate

apersonalized

pitchdecktailoredtoJohn's

profile

-

highlight

uniquefeatures,visualappeal,

neighborhoodvibe,andwhyeach

propertywould

resonatewith

hiscreative

lifestyle難度等級(jí):高級(jí)任務(wù)來(lái)源:

ManusAI(@ManusAI_HQ)/ManusAI_HQ/status/1947672991455973486任務(wù)難度:4.2任務(wù)分析:涉及搜索、

PPT生成目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|53紐約租房PPT2025/7/28產(chǎn)品完成時(shí)間(s)測(cè)試結(jié)果(人工評(píng)價(jià))相關(guān)鏈接OpenAIAgent2940部分成功對(duì)話鏈接

PPT鏈接Perp

Comet35失敗對(duì)話鏈接Manus540失敗對(duì)話鏈接Genspark360部分成功對(duì)話鏈接

PPT鏈接Prompt:

I'ma

realtor

helpingmyclientJohn,acreative

directorand

interior

design

enthusiast,

find

a

2-bedroomrental

in

NewYorkCity.

He'slookingforanapartmentwitha

spacious

layout,

eclectic

or

design-forward

interior,

access

to

sports

facilities

and

a

swimming

pool,andgoodconnectivityto

Manhattan

(ideallywithin

30

minutes).Hisbudgetis

upto

$5000

USD/month.Use

reputablerental

listing

platformstofindtopoptions,Thencreatea

personalized

pitch

decktailored

toJohn's

profile

-

highlight

uniquefeatures,visualappeal,

neighborhoodvibe,andwhyeach

propertywouldresonatewith

hiscreative

lifestyle紐約租房PPT

耗時(shí)&結(jié)果目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|542025/7/28紐約租房PPT

測(cè)試結(jié)果

AI分析結(jié)果目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|55鏈接鏈接鏈接鏈接2025/7/28測(cè)試感受(人寫)?

任務(wù)部分成功。?

用時(shí)太長(zhǎng)了,實(shí)在太慢了,49分鐘產(chǎn)出的PPT是

什么樣子呢??

打開(kāi)發(fā)現(xiàn)房屋圖片是AI生成的,嚴(yán)重降低了此

PPT的實(shí)用性,甚至?xí)`導(dǎo)用戶。?

而文字部分是真實(shí)房源,點(diǎn)擊分析過(guò)程的鏈接可

以看到對(duì)應(yīng)的房源實(shí)拍圖。希望能抓取實(shí)拍圖放到PPT中。目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|56紐約租房PPT-openAIAgent OpenAI

Agent執(zhí)行結(jié)果:

部分成功鏈接圖片來(lái)自測(cè)試界面截圖,

PPT鏈接2025/7/28目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|57紐約租房PPT

Comet測(cè)試感受(人寫)?

任務(wù)失敗。?

無(wú)法生成ppt,也沒(méi)有給出任何圖例。如果只是

文字性信息,你和claude有什么區(qū)別 Comet執(zhí)行結(jié)果:

失敗

鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28測(cè)試感受(人寫)?

任務(wù)失敗。?

僅找到了1個(gè)合適的房源,和幾個(gè)推薦的社區(qū),

分析了社區(qū)的優(yōu)缺點(diǎn),各種圖表特別專業(yè),

PPT

也很好看,這次PPT配色圖文編排都特別好看。?

但是PPT中沒(méi)有給出對(duì)應(yīng)的聯(lián)系方式或網(wǎng)站鏈接,

即使John相中了房子也沒(méi)法直接聯(lián)系租到,沒(méi)什么實(shí)際用處目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|58紐約租房PPT

ManusManus執(zhí)行結(jié)果:

失敗

鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|59紐約租房PPT-Genspark測(cè)試感受(人寫)?

任務(wù)部分成功。?

分析了幾個(gè)房源網(wǎng)站,找到了合適的房源,和幾

個(gè)推薦的社區(qū),分析了優(yōu)缺點(diǎn)。?

但是PPT中沒(méi)有給出對(duì)應(yīng)的聯(lián)系方式或網(wǎng)站鏈接,

即使John相中了房子也沒(méi)法直接聯(lián)系租到,沒(méi)什么實(shí)際用處 Genspark執(zhí)行結(jié)果:

部分成功

鏈接圖片來(lái)自測(cè)試界面截圖,

PPT鏈接2025/7/28LLM產(chǎn)業(yè)報(bào)告+PPTLLM產(chǎn)業(yè)報(bào)告+PPT目錄

|作者

|測(cè)試感受

|難度分級(jí)說(shuō)明

|金融

|市場(chǎng)

|

教育

|其他

|結(jié)尾

|附件

aiwatch.ai

|602025/7/28Prompt:調(diào)查所有LLM的數(shù)據(jù)和信息,撰寫一篇面向AI

startup的LLM深度

研究報(bào)告,設(shè)計(jì)并建構(gòu)2級(jí)、

3級(jí)指標(biāo)并對(duì)其性能和參數(shù)進(jìn)行量化分

析,最后對(duì)整個(gè)AI產(chǎn)業(yè)從2022年至今的模型演化制作一個(gè)演講PPT,

向團(tuán)隊(duì)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論