




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
測(cè)報(bào)告2025.07.25郎瀚威/GPTDAO貓貓頭AIwatch.ai1011紐約租房PPT12LLM產(chǎn)業(yè)報(bào)告+PPT13AI
Agents教程指南14奈飛電影Excel+郵件15HomeBots策略PPT16結(jié)尾17附件180102關(guān)于作者03測(cè)試感受04測(cè)試結(jié)果05難度分級(jí)說(shuō)明06ETH價(jià)格預(yù)測(cè)07會(huì)員經(jīng)濟(jì)GDP分析08美股歷史跌幅分析09制定提前退休計(jì)劃PPT目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|2目錄市場(chǎng)教育其他
{巴黎旅行PPT制作2025/7/28目錄金融時(shí)間單位:秒OpenAICometManusGensparkPrompt分類綜合難度時(shí)間結(jié)果時(shí)間結(jié)果時(shí)間結(jié)果時(shí)間結(jié)果1ETH價(jià)格預(yù)測(cè)(報(bào)告)金融2.8120失敗27成功600成功
323成功2會(huì)員經(jīng)濟(jì)GDP分析(報(bào)告)金融3.8600成功22成功780成功
266成功3美股歷史跌幅分析(報(bào)告)金融4.3720成功50成功1,440成功360成功4制定提前退休計(jì)劃PPT(PPT)金融4.4960成功有PPT35失敗無(wú)PPT
300成功有PPT1,080成功有PPT5巴黎旅行PPT制作(PPT)市場(chǎng)3.11,560成功有PPT216失敗無(wú)PPT
300成功有PPT420成功有PPT6紐約租房PPT(PPT)市場(chǎng)4.22,940部分成功有PPT35失敗無(wú)PPT540失敗有PPT360部分成功有PPT7LLM產(chǎn)業(yè)報(bào)告+PPT(PPT)市場(chǎng)4.71,380成功有PPT85失敗無(wú)PPT540部分成功有PPT1,500成功有PPT8AIAgents教程指南(報(bào)告)教育3.6420成功16成功
300成功720成功9奈飛電影Excel+郵件(報(bào)告)其他3.1566部分成功69失敗660部分成功
300部分成功平均時(shí)間1,03062607592正確錯(cuò)誤比例8/14/58/19/0目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|
其他
|結(jié)尾
|附件
aiwatch.ai
|4PPT+短報(bào)告測(cè)試結(jié)果注釋:該表格中測(cè)試結(jié)果成功與否均為人工評(píng)價(jià),會(huì)存在人工評(píng)價(jià)與AI不一致的情況(例如Prompt下達(dá)多個(gè)指令時(shí)(輸出表格+發(fā)郵件),Agent完成了部分(輸出表格),AI會(huì)判定為失敗,人工會(huì)判定為部分成功)2025/7/28?
這是我們第二次出報(bào)告,和上次綜合類不同,這次選擇的是報(bào)告類,這也是最大的垂類。?本次是一共9個(gè)任務(wù),5個(gè)PPT
,4個(gè)報(bào)告,未來(lái)深度報(bào)告會(huì)獨(dú)立測(cè)試。?本次測(cè)試結(jié)論是,
用通用AI
Agent生成文檔,已經(jīng)達(dá)到初步可用水平,
也發(fā)現(xiàn)一些問(wèn)題:?1、當(dāng)前AI
Agent生態(tài)各有短板,沒(méi)有一家在所有方面都表現(xiàn)完美。?2、對(duì)于通用Agent,步驟更多,
因此數(shù)據(jù)幻覺(jué)是危險(xiǎn)的問(wèn)題,現(xiàn)階段AI生成內(nèi)容必須全面驗(yàn)證,不能因?yàn)榍皫讞l正確就信任整體。?3、直接承認(rèn)能力局限,反而贏得信任,真正的行業(yè)進(jìn)步需要直接的問(wèn)題反饋和整個(gè)生態(tài)的共同迭代,而非單一平臺(tái)獨(dú)大。?
歡迎到推特和公眾號(hào)留言,我們會(huì)持續(xù)收集Prompt,目前已經(jīng)將報(bào)告類Prompt看板開(kāi)源(
https://three-recorder-
52a.notion.site/23efc520994e801aa636cb5d82523972?v=23efc520994e80eb96a2000caa6c0174)目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|5報(bào)告一些Takeaway-by郎瀚威2025/7/28這次測(cè)試我分別測(cè)了5個(gè)任務(wù)在Genspark、
Manus、OpenAI上的表現(xiàn),還有5個(gè)任務(wù)分別在Genspark、
Manus上的表現(xiàn)。核心觀點(diǎn):AI生成內(nèi)容必須仔細(xì)驗(yàn)證。功能完整度、誠(chéng)實(shí)度、內(nèi)容質(zhì)量各有優(yōu)劣
,沒(méi)有一家在所有方面都表現(xiàn)完美
,當(dāng)前AIAgent生態(tài)還不成熟,各有明顯短板
,需要持續(xù)反饋和迭代來(lái)推動(dòng)整體進(jìn)步發(fā)現(xiàn)了一些問(wèn)題:1、幻覺(jué)問(wèn)題:
Manus在統(tǒng)計(jì)奈飛電影Top50時(shí),發(fā)現(xiàn)自己沒(méi)有能力統(tǒng)計(jì),轉(zhuǎn)而找了幾個(gè)測(cè)評(píng)文章,將文章數(shù)據(jù)抓下來(lái)寫道了表格中,但是抓取的文章內(nèi)容僅統(tǒng)計(jì)了Top20的數(shù)據(jù),對(duì)于另外的30個(gè),
Manus采取的策略是亂編,電影名直接是“知名電影#21“,觀看次數(shù)和觀看小時(shí)數(shù)竟然是呈等差數(shù)列降序排列!??!給我氣笑了,有一種上學(xué)時(shí)老師說(shuō)”不會(huì)的題,寧可編上也別空著“的感覺(jué)。當(dāng)時(shí)我剛跑完這個(gè)任務(wù),它還大大方方的承認(rèn)了無(wú)法發(fā)郵件,給我一種很誠(chéng)實(shí)的感覺(jué),對(duì)于表格內(nèi)的數(shù)據(jù)我也是簡(jiǎn)單的看了前面十幾條內(nèi)容,覺(jué)得收集的還不錯(cuò)?;仡^細(xì)看才發(fā)現(xiàn)這個(gè)濃眉大眼的manus居然騙了我。我相信這也是很多用戶可能會(huì)面臨的情況,所以AI生成的東西一
定一定一定要仔細(xì)檢查。同樣的任務(wù),OpenAI和Genspark確實(shí)訪問(wèn)奈飛官網(wǎng)抓取的Top10,剩余的資料是從別處獲得的。發(fā)送郵件時(shí),雖然都沒(méi)有發(fā)送成功,OAI是唯一一個(gè)成功將文件保存至草稿箱中的。Comet大大方方的承認(rèn)了無(wú)法抓取奈飛內(nèi)容,也沒(méi)有去找其他文章內(nèi)容的Top50資料,反而可信度是很高的,在我這里猛刷了一波好感。目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|6測(cè)試感受
bywill團(tuán)隊(duì)成員1
dyr(測(cè)了22個(gè)任務(wù)在三家的表現(xiàn))2025/7/282、導(dǎo)出Bug:
制定退休計(jì)劃PPT的任務(wù),
Genspark生成了15頁(yè)賞心悅目的PPT,可惜它的導(dǎo)出功能還在Beta階段,
導(dǎo)出失敗
了。其實(shí)平時(shí)導(dǎo)出Genspark的PPT也普遍較慢,但是這次是第一次遇到死活導(dǎo)出不了的現(xiàn)象(無(wú)論是PDF格式還是PPT格式我
都試過(guò)N遍,隔天又試了N遍,
還是不行)3、
Openai平庸的PPT:
OAI推出PPT功能,
結(jié)果效果非常不好。拋開(kāi)內(nèi)容不談,丑PPT這個(gè)賽道OpenAI你也是闖進(jìn)去了,幾
乎每一張都是白底,而且如果左側(cè)文字過(guò)長(zhǎng)但凡右側(cè)有個(gè)柱形圖折線圖什么的,柱形圖折線圖恨不得貼到邊邊太極限了(提前
制定退休計(jì)劃PPT)。4、按需定制與內(nèi)容冗長(zhǎng):AI
Agents教程指南那個(gè)任務(wù),需要教給Agent小白一些Agent基礎(chǔ)知識(shí)以及如何使用,
并且列舉并
教小白使用10個(gè)最受歡迎的Agent。
Manus、
Genspark、
OAI都成功了,但是Manus寫的最長(zhǎng),仔細(xì)讀過(guò)后覺(jué)得和Genspark、Openai比有很多不務(wù)實(shí)的東西,不夠精煉,比如未來(lái)展望、繼續(xù)學(xué)習(xí),行動(dòng)建議和逐步實(shí)施的計(jì)劃重復(fù)了。我認(rèn)為如果是教程
類的東西,針對(duì)小白應(yīng)該簡(jiǎn)單精煉一些才是好的教程。當(dāng)然這個(gè)是我個(gè)人感受,
可能有人更喜歡面面俱到事無(wú)巨細(xì)的學(xué)習(xí)形式。抱歉這次攻擊性有點(diǎn)強(qiáng)了,但出發(fā)點(diǎn)并不是為了“一錘定音”,
而是希望能推動(dòng)大家更清晰地看到問(wèn)題所在。說(shuō)到底,
這些Agent背后都是一群非常優(yōu)秀、也在持續(xù)迭代的團(tuán)隊(duì)。我相信,只要方向?qū)?、反饋及時(shí),大家完全有能力在下一輪把體驗(yàn)拉到
一個(gè)新高度。畢竟,真正的進(jìn)步,從來(lái)不是一家獨(dú)大,而是整個(gè)生態(tài)一起往前走的節(jié)奏。目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|7測(cè)試感受
bywill團(tuán)隊(duì)成員1
dyr-續(xù)2025/7/28這次測(cè)試我測(cè)了5個(gè)任務(wù)OpenAI上的表現(xiàn)。核心觀點(diǎn):
OpenAI
Agent雖然在某些技術(shù)能力上有優(yōu)勢(shì),但在用戶體驗(yàn)的關(guān)鍵指標(biāo)上
(效率、內(nèi)容質(zhì)量、問(wèn)題解決的直接性)還有明顯不足,性價(jià)比有待提升。?
先說(shuō)好的方面,在一些任務(wù)上表現(xiàn)還不錯(cuò),比如發(fā)郵件這個(gè)任務(wù),還是比Comet、
Manus和Genspark超前一些,
其他都不
能發(fā)送郵件,最起碼OpenAI編輯的郵件還躺在了草稿箱里。另外就是數(shù)據(jù)爬取上對(duì)比下來(lái)感覺(jué)還是可以的。?
當(dāng)然缺點(diǎn)也很明顯:?
首先,耗時(shí)實(shí)在太久。有些任務(wù)執(zhí)行了40多分鐘,
這個(gè)時(shí)間實(shí)在讓人有點(diǎn)難以接受,
尤其是考慮到價(jià)格還不便宜。?
再就是,PPT制作質(zhì)量。比起Genspark和Manus
,
OpenAI生成的PPT質(zhì)量明顯差很多,
真的真的真的太丑了,
根本沒(méi)辦法
實(shí)際使用,唯一可能比Comet稍微好一點(diǎn),
為啥這么說(shuō)呢?因?yàn)镃omet沒(méi)法生成PPT,只是提供一些建議,所以有總比沒(méi)有
強(qiáng)吧。還有就是OpenAI在分析、生成研究報(bào)告的時(shí)候,
并不是很深度,有點(diǎn)差強(qiáng)人意。?
另外一個(gè)問(wèn)題是,OpenAI在遇到不能解決的問(wèn)題時(shí),通常采取的是“繞路”的方式。它會(huì)去網(wǎng)上搜索別人怎么解決類似問(wèn)
題的辦法,然后把這些辦法告訴你。雖然這種方式有時(shí)能幫忙,
但還是沒(méi)有真正從根本上解決問(wèn)題,感覺(jué)有點(diǎn)被欺騙的感覺(jué)。目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|8測(cè)試感受
bywill團(tuán)隊(duì)成員2zwt
(測(cè)了5個(gè)任務(wù)在openAl的表現(xiàn))2025/7/28目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|9接下來(lái)的測(cè)試計(jì)劃2025/7/28
數(shù)據(jù)來(lái)源:
similarweb單位:萬(wàn)visit我們用Claude做了難度分級(jí),相關(guān)Prompt
,難度評(píng)級(jí)分析表https://claude.ai/share/a71bf4c9-de89-4204-b3dc-590b96dd25c1難度等級(jí)說(shuō)明1-2分:簡(jiǎn)單級(jí)-基礎(chǔ)任務(wù),單一工具,
minimal專業(yè)知識(shí)2-3分:中低級(jí)-需要一定理解和分析能力3-4分:中高級(jí)-需要專業(yè)知識(shí)和多步驟思考4-5分:專家級(jí)-需要深度專業(yè)知識(shí)和綜合能力關(guān)鍵難度因素1.高難度驅(qū)動(dòng)因素:大型輸出要求(2萬(wàn)字)、高度專業(yè)領(lǐng)域知識(shí)、多維度分析2.中等難度特征:實(shí)時(shí)信息搜索、內(nèi)容理解和提取、多步驟任務(wù)3.復(fù)雜度escalation:
從簡(jiǎn)單信息檢索到專業(yè)投資分析的跨度很大特殊注釋:*這個(gè)prompt雖然表面簡(jiǎn)單,但實(shí)際上AI無(wú)法直接執(zhí)行購(gòu)買操作,需要用戶自行完成或使用專門的購(gòu)物API工具。目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|10難度分級(jí)說(shuō)明2025/7/28序號(hào)Prompt簡(jiǎn)述分類綜合難度等級(jí)主要挑戰(zhàn)認(rèn)知復(fù)雜度領(lǐng)域?qū)I(yè)性任務(wù)結(jié)構(gòu)信息處理要求輸出要求工具使用1Eth價(jià)格預(yù)測(cè)金融2.8預(yù)測(cè)準(zhǔn)確性、免責(zé)聲明簡(jiǎn)單中等-金融單步驟中等-市場(chǎng)數(shù)據(jù)文本預(yù)測(cè)單工具(搜索+分析)2美股歷史跌幅分析金融4.2實(shí)時(shí)房源信息、個(gè)性化匹配中等中等-房地產(chǎn)多步驟高-需整合多源PPT+個(gè)性化多工具(搜索+設(shè)計(jì))3制定提前退休計(jì)劃PPT金融4.2Box文檔訪問(wèn)限制、保密性中等高-企業(yè)戰(zhàn)略多步驟高-文檔整合策略PPT多工具(文檔+設(shè)計(jì))4會(huì)員經(jīng)濟(jì)GDP分析金融4.7快速變化的AI產(chǎn)業(yè)、量化指標(biāo)設(shè)計(jì)極高極高-AI產(chǎn)業(yè)多步驟極高-全面研究深度報(bào)告+PPT多工具(研究+分析+設(shè)計(jì))5制作巴黎旅行PPT市場(chǎng)3.1大量數(shù)據(jù)整理、郵件發(fā)送限制中等低-娛樂(lè)多步驟高-大量數(shù)據(jù)多工具(Excel+郵件)多工具(搜索+Excel+郵件)6紐約租房PPT市場(chǎng)3.1視覺(jué)設(shè)計(jì)、內(nèi)容豐富度中等低-旅游多步驟中等-需整合多工具(PPT+圖片)多工具(搜索+設(shè)計(jì))7LLM產(chǎn)業(yè)報(bào)告+PPT市場(chǎng)4.4復(fù)雜建模、稅法變化、地區(qū)差異高高-財(cái)務(wù)規(guī)劃多步驟極高-復(fù)雜建模模型+PPT多工具(建模+設(shè)計(jì))8AI
Agents教程指
南教育4.3歷史數(shù)據(jù)準(zhǔn)確性、因果分析高高-金融歷史多步驟極高-歷史數(shù)據(jù)詳細(xì)報(bào)告多工具(研究+分析)9奈飛Top50電影Excel+發(fā)郵件其他3.8宏觀經(jīng)濟(jì)數(shù)據(jù)獲取、多維分析高高-經(jīng)濟(jì)學(xué)多步驟極高-多維度數(shù)據(jù)長(zhǎng)文檔+數(shù)據(jù)多工具(研究+分析)10HomeBots策略PPT其他3.6技術(shù)深度vs通俗易懂平衡中等中等-AI技術(shù)多步驟中等-結(jié)構(gòu)化長(zhǎng)文檔+列表單工具(搜索)目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|11prompt難度評(píng)級(jí)分析表難度評(píng)級(jí)分析表https://claude.ai/share/a71bf4c9-de89-4204-b3dc-590b96dd25c12025/7/28ETH價(jià)格預(yù)測(cè)ETH價(jià)格預(yù)測(cè)目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|122025/7/28Prompt:來(lái)個(gè)eth價(jià)格預(yù)測(cè)?forfun.看看它說(shuō)的在理不(請(qǐng)進(jìn)行未來(lái)24小時(shí)的eth價(jià)格預(yù)測(cè))難度等級(jí):
中低級(jí)任務(wù)來(lái)源:硅谷王川群友-劉淵AI評(píng)價(jià)任務(wù)難度:
2.8任務(wù)分析:涉及搜索、分析、報(bào)告生成ETH價(jià)格預(yù)測(cè)目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|132025/7/28產(chǎn)品完成時(shí)間(s)測(cè)試結(jié)果(人工評(píng)價(jià))相關(guān)鏈接OpenAIAgent120失敗對(duì)話鏈接Perp
Comet27成功對(duì)話鏈接Manus600成功對(duì)話鏈接Genspark323成功對(duì)話鏈接ETH價(jià)格預(yù)測(cè)
-
耗時(shí)&結(jié)果目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|14Prompt:來(lái)個(gè)eth價(jià)格預(yù)測(cè)?forfun.看看它說(shuō)的在理不(請(qǐng)進(jìn)行未來(lái)24小時(shí)的eth價(jià)格預(yù)測(cè))2025/7/28ETH價(jià)格預(yù)測(cè)
-
測(cè)試結(jié)果
AI分析結(jié)果目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|15鏈接鏈接鏈接鏈接2025/7/28測(cè)試感受(人寫)?
任務(wù)失敗。?
單對(duì)于OpenAI來(lái)說(shuō),它明確指出不能做出價(jià)格預(yù)測(cè)提供投資建議,所以這個(gè)任務(wù)OpenAI是沒(méi)
有辦法去完成的,但是會(huì)給你搜集一些市場(chǎng)信息,
只能說(shuō)挺誠(chéng)實(shí)的。?
相對(duì)于另外3家來(lái)說(shuō),OpenAI給出的結(jié)果非常簡(jiǎn)
陋,沒(méi)什么有用的信息。目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|16ETH價(jià)格預(yù)測(cè)
open
AI
Agent OpenAI
Agent執(zhí)行結(jié)果:
失敗
鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|17ETH價(jià)格預(yù)測(cè)
comet測(cè)試感受(人寫)?
任務(wù)成功。?
預(yù)測(cè)質(zhì)量高、準(zhǔn)確性好、內(nèi)容專業(yè)、滿足核心需
求。但是時(shí)間上有問(wèn)題 Comet執(zhí)行結(jié)果:
成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28測(cè)試感受(AI寫)?
任務(wù)成功。?由于測(cè)試者不了解幣,故使用Kimi
K2模型對(duì)測(cè)
試結(jié)果進(jìn)行評(píng)價(jià),以下是Kimi
K2的評(píng)價(jià)內(nèi)容:?24小時(shí)預(yù)測(cè)邏輯與實(shí)時(shí)行情、主流技術(shù)模型一致,不存在“胡說(shuō)八道”。目標(biāo)價(jià)
$3,817(+3.0%)?
與CoinDesk模型給出的區(qū)間上沿3,763-4,106
美元(斐波那契擴(kuò)展
1.0位)基本匹配。目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|18ETH價(jià)格預(yù)測(cè)ManusManus執(zhí)行結(jié)果:
成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28測(cè)試感受(AI寫)?
任務(wù)成功。?由于測(cè)試者不了解幣,故使用Kimi
K2模型對(duì)測(cè)
試結(jié)果進(jìn)行評(píng)價(jià),以下是Kimi
K2的評(píng)價(jià)內(nèi)容:?
這份24小時(shí)
ETH預(yù)測(cè)總體邏輯自洽、數(shù)據(jù)來(lái)源可核,報(bào)告給出3,650-3,900區(qū)間、35%概率3,900-4,000;實(shí)際24小時(shí)后(截至Jul2306:30UTC)價(jià)格
≈
3,750,落在“基準(zhǔn)情形”內(nèi),誤差
<2%,但仍在區(qū)間中值附近,不能說(shuō)
明模型“精準(zhǔn)命中”。?
但24小時(shí)“點(diǎn)位”預(yù)測(cè)天然屬于高噪聲、低精度的統(tǒng)計(jì)游戲。把它當(dāng)成“概率區(qū)間
+風(fēng)控模板”是合理的;若理解為“明天一定漲到3,900”就屬于誤讀。投資者仍需自行判斷并承擔(dān)波動(dòng)風(fēng)險(xiǎn)。目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|19ETH價(jià)格預(yù)測(cè)
Gen
sparkGenspark執(zhí)行結(jié)果:
成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28會(huì)員經(jīng)濟(jì)GDP分析會(huì)員經(jīng)濟(jì)GDP分析目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|
教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|202025/7/28的分布,典型代表公司案例,會(huì)員總規(guī)模是多少?
1天下來(lái)會(huì)員為經(jīng)濟(jì)做出多大的貢獻(xiàn)?難度等級(jí):
中高級(jí)任務(wù)來(lái)源:群友-周江嶺任務(wù)難度:
3.8任務(wù)分析:涉及搜索、分析、報(bào)告生成會(huì)員經(jīng)濟(jì)GDP分析Prompt:會(huì)員經(jīng)濟(jì)占美國(guó)經(jīng)濟(jì)GDP的比重是多少?
3個(gè)產(chǎn)業(yè)的分布,各個(gè)行業(yè)目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|
教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|212025/7/28產(chǎn)品完成時(shí)間(s)測(cè)試結(jié)果(人工評(píng)價(jià))相關(guān)鏈接OpenAIAgent600成功對(duì)話鏈接Perp
Comet22成功對(duì)話鏈接Manus780成功對(duì)話鏈接Genspark266成功對(duì)話鏈接會(huì)員經(jīng)濟(jì)GDP分析-耗時(shí)&結(jié)果Prompt:會(huì)員經(jīng)濟(jì)占美國(guó)經(jīng)濟(jì)GDP的比重是多少?3個(gè)產(chǎn)業(yè)的分布,各個(gè)行業(yè)的分布,典型代表公司案例,會(huì)員總規(guī)模是多少?
1天下來(lái)會(huì)員為
經(jīng)濟(jì)做出多大的貢獻(xiàn)?目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|
教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|222025/7/28會(huì)員經(jīng)濟(jì)GDP分析-
測(cè)試結(jié)果
AI分析結(jié)果目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|
教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|23鏈接鏈接鏈接鏈接2025/7/28目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|
教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|24會(huì)員經(jīng)濟(jì)GDP分析open
AI
Agent測(cè)試感受(人寫)?
任務(wù)成功。?
耗時(shí)上來(lái)看OpenAI算是比較長(zhǎng)的,跟Manus有
的一拼?
從生成的報(bào)告上來(lái)看,OpenAI表現(xiàn)還ok,好在
任務(wù)是成功了的,最起碼所有的問(wèn)題都給出了答
案。 OpenAI
Agent執(zhí)行結(jié)果:
成功
鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|
教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|25會(huì)員經(jīng)濟(jì)GDP分析
comet測(cè)試感受(人寫)?
任務(wù)成功。?回答了Prompt里提出的所有問(wèn)題,倒也算是“事事有回應(yīng)”?
不過(guò)希望可以有排版上的改進(jìn),條分縷析,要么
看的頭大。 Comet執(zhí)行結(jié)果:
成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28測(cè)試感受(人寫)?
任務(wù)成功。?
市場(chǎng)規(guī)模與GDP占比規(guī)模估算可靠。滲透率與用
戶畫像屬于合理區(qū)間。對(duì)于就業(yè)、稅收的估算是與牛津經(jīng)濟(jì)研究院2024《DigitalSubscriptionWorkforce
Report》430-480萬(wàn)區(qū)間。?
年稅收775億美元與美國(guó)經(jīng)濟(jì)分析局(BEA)“數(shù)字服務(wù)相關(guān)企業(yè)所得稅+薪酬稅”估算處于同一量級(jí)。估算方法主流,無(wú)夸大。目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|
教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|26會(huì)員經(jīng)濟(jì)GDP分析
ManusManus執(zhí)行結(jié)果:
成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|
教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|27會(huì)員經(jīng)濟(jì)GDP分析
Gen
spark測(cè)試感受(人寫)?
任務(wù)成功。?
每個(gè)關(guān)鍵數(shù)字都有對(duì)應(yīng)的來(lái)源,也能在公開(kāi)權(quán)威
資料或主流第三方研究中找到對(duì)應(yīng)或近似的口徑,
僅存在少量“時(shí)間差”或“四舍五入”導(dǎo)致的微
小差異,整體可信度較高。Genspark執(zhí)行結(jié)果:
成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28美股歷史跌幅分析目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|
教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|28美股歷史跌幅分析2025/7/28Prompt:分析美股從交易所成立至今,所有下跌30-50%的時(shí)間點(diǎn),事件,歷史背景,總結(jié)主要原因,越詳細(xì)越好難度等級(jí):高級(jí)任務(wù)來(lái)源:群友-HEXIN生財(cái)任務(wù)難度:4.3任務(wù)分析:涉及搜索、分析、報(bào)告生成目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|
教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|29美股歷史跌幅分析2025/7/28產(chǎn)品完成時(shí)間(s)測(cè)試結(jié)果(人工評(píng)價(jià))相關(guān)鏈接OpenAIAgent成功對(duì)話鏈接Perp
Comet50成功對(duì)話鏈接Manus1440成功對(duì)話鏈接Genspark360成功對(duì)話鏈接目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|30美股歷史跌幅分析
耗時(shí)&結(jié)果Prompt:分析美股從交易所成立至今,所有下跌30-50%的時(shí)間點(diǎn),事件,歷史背景,總結(jié)主要原因,越詳細(xì)越好2025/7/28720美股歷史跌幅分析
測(cè)試結(jié)果
AI分析結(jié)果目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|31鏈接鏈接鏈接鏈接2025/7/28目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|32美股歷史跌幅分析
open
AI
Agent測(cè)試感受(人寫)?
任務(wù)成功。?
這次OpenAI生成的結(jié)果結(jié)構(gòu)還比較清晰,算是
結(jié)構(gòu)上比較滿意的一個(gè)報(bào)告,耗時(shí)12分鐘倒也還
行,表現(xiàn)中規(guī)中矩。 OpenAI
Agent執(zhí)行結(jié)果:
成功
鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|33美股歷史跌幅分析
comet測(cè)試感受(人寫)?
任務(wù)成功。?
給出了多個(gè)股市暴跌事件,給出了時(shí)間點(diǎn),歷史
背景,直接事件,并且也進(jìn)行了原因分析?
不過(guò)分析不夠細(xì)致,沒(méi)有做到越詳細(xì)越好,整體
任務(wù)是完成了的。Comet執(zhí)行結(jié)果:
成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|34美股歷史跌幅分析Manus測(cè)試感受(人寫)?
任務(wù)成功。?Manus給出的結(jié)果是最詳細(xì)最多的,有5萬(wàn)字的報(bào)告,包含了每個(gè)股災(zāi)的深度案例分析、理論總
結(jié)、政策啟示和風(fēng)險(xiǎn)防范建議。?
關(guān)鍵跌幅數(shù)據(jù)與主流金融史資料基本一致,理論
引用來(lái)源權(quán)威,無(wú)斷章取義現(xiàn)象Manus執(zhí)行結(jié)果:
成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|35美股歷史跌幅分析
Gen
spark測(cè)試感受(AI寫)?
任務(wù)成功。?
所有案例均有至少一個(gè)權(quán)威來(lái)源支持,早期市場(chǎng)
明確標(biāo)注數(shù)據(jù)局限性,對(duì)1929年、2008年等超50%跌幅的事件僅作背景說(shuō)明,未計(jì)入主表,符
合報(bào)告設(shè)定;無(wú)夸大或虛構(gòu)。?
整體信息是準(zhǔn)確的,沒(méi)有發(fā)現(xiàn)“胡說(shuō)八道”的情
況Genspark執(zhí)行結(jié)果:
成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28制定提前退休計(jì)劃PPT目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|36制定提前退休計(jì)劃PPT2025/7/28Prompt:Createa
FIRE
modelforsomeoneearning$500k/yearwhowantsto
retireat
30with
$5M.
Modelextremesavingsrates{80%+)
taxoptimization,investmentstrategiesforefficientcompounding,andlifestylecosts
livinginVancouver,Canada.
Includescenariosfordifferentwithdrawal
ratesandshowwhatsacrificesare
requiredvstraditional
retirementplanning,Then,createa
presentationtodownload.難度等級(jí):高級(jí)任務(wù)來(lái)源:
RowanCheun(
@rowancheung)/rowancheung/status/1945896543263080736任務(wù)難度:4.4任務(wù)分析:涉及分析、
PPT生成目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|37制定提前退休計(jì)劃PPT2025/7/28產(chǎn)品完成時(shí)間(s)測(cè)試結(jié)果(人工評(píng)價(jià))相關(guān)鏈接OpenAIAgent960成功對(duì)話鏈接
PPT鏈接Perp
Comet35失敗對(duì)話鏈接Manus300成功對(duì)話鏈接Genspark1080成功對(duì)話鏈接
PPT鏈接Prompt:Createa
FIRE
modelforsomeoneearning
$500k/yearwhowants
to
retire
at
30
with
$5M.
Model
extreme
savings
rates
{80%+)taxoptimization,investment
strategiesforefficientcompounding,and
lifestyle
costs
living
in
Vancouver,
Canada.
Includescenariosfordifferentwithdrawal
ratesandshowwhatsacrifices
are
requiredvs
traditional
retirement
planning,
Then,
create
apresentationtodownload.目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|38制定提前退休計(jì)劃PPT
-
耗時(shí)&結(jié)果2025/7/28制定提前退休計(jì)劃PPT
-
測(cè)試結(jié)果
AI分析結(jié)果目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|39鏈接鏈接鏈接鏈接2025/7/28測(cè)試感受(人寫)?
任務(wù)成功。結(jié)論是提前退休的可能性很小,并給
出了提前退休的方案。?PPT簡(jiǎn)潔但是丑!丑到甚至不能叫PPT了。?
但是給出的結(jié)論和建議是合理的,OAI在做分析
這一塊確實(shí)很好。?由于美元和加元的符號(hào)一樣,不同Agent識(shí)別成了不同的內(nèi)容,所以結(jié)果不同,主要看各Agent
處理問(wèn)題的邏輯思路目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|40制定提前退休計(jì)劃PPT-openAIAgent OpenAI
Agent執(zhí)行結(jié)果:
成功
鏈接圖片來(lái)自測(cè)試界面截圖,
PPT鏈接2025/7/28目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|41制定提前退休計(jì)劃PPT
Comet Comet執(zhí)行結(jié)果:
失敗
鏈接測(cè)試感受(人寫)?
任務(wù)失敗。無(wú)法生成ppt圖片來(lái)自測(cè)試界面截圖2025/7/28目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|42制定提前退休計(jì)劃PPT
Manus測(cè)試感受(人寫)?
任務(wù)成功。?已建立儲(chǔ)蓄率、投資回報(bào)率、稅務(wù)優(yōu)化等模型,雖然做不到30歲的極限可行路徑,調(diào)整為L(zhǎng)eanFIRE目標(biāo)($150萬(wàn)加元)并延長(zhǎng)時(shí)間框架至12年是可行的,并且給出了詳細(xì)有道理的策略,整
體看比較務(wù)實(shí)Manus執(zhí)行結(jié)果:
成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|43制定提前退休計(jì)劃PPT-Genspark測(cè)試感受(人寫)?
任務(wù)成功。?
給出的所有要求全部量化到位,給出了RRSP+TFSA稅優(yōu)組合在其他Agent也同樣提出
了,還有風(fēng)險(xiǎn)清單和緩解方案,列出了住房降級(jí)、
社交犧牲、高壓職業(yè)等隱性代價(jià),也給出動(dòng)態(tài)調(diào)整退休年齡或目標(biāo)的務(wù)實(shí)建議Genspark執(zhí)行結(jié)果:
成功鏈接圖片來(lái)自測(cè)試界面截圖,
PPT鏈接2025/7/28制作巴黎旅行PPT目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|44制作巴黎旅行PPT2025/7/28Prompt:Createavisually
rich8-slide
presentationfeaturing
anunforgettable
Paristravel
itinerary,
completewithdetaileddescriptionsandstunning
imagery.難度等級(jí):
中級(jí)任務(wù)來(lái)源:CharlyWargnier(@DataChaz)/DataChaz/status/1947440106811625521任務(wù)難度:
3.1任務(wù)分析:涉及搜索、
PPT生成目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|45制作巴黎旅行PPT2025/7/28產(chǎn)品完成時(shí)間(s)測(cè)試結(jié)果(人工評(píng)價(jià))相關(guān)鏈接OpenAIAgent1560成功對(duì)話鏈接
PPT鏈接Perp
Comet216失敗對(duì)話鏈接Manus300成功對(duì)話鏈接Genspark420成功對(duì)話鏈接
PPT鏈接制作巴黎旅行PPT
-
耗時(shí)&結(jié)果Prompt:Createavisually
rich8-slide
presentationfeaturingan
unforgettable
Paristravel
itinerary,completewith
detaileddescriptionsandstunning
imagery.目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|462025/7/28制作巴黎旅行PPT測(cè)試結(jié)果AI分析結(jié)果目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|47鏈接鏈接鏈接鏈接2025/7/28目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|48制作巴黎旅行PPT-openAIAgent測(cè)試感受(人寫)?
任務(wù)成功。?
給出了3天的巴黎之旅規(guī)劃,涵蓋了各大必去景
點(diǎn),還給了旅行小Tips,整體內(nèi)容和其他3個(gè)差不多,只是輸在圖文排版上了?圖找的很好看,但是排版感覺(jué)非常生硬,色彩也
是搭配的很丑。26分鐘就給我出來(lái)了個(gè)這? OpenAI
Agent執(zhí)行結(jié)果:
成功
鏈接圖片來(lái)自測(cè)試界面截圖,
PPT鏈接2025/7/28目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|49制作巴黎旅行PPT
Comet測(cè)試感受(人寫)?
任務(wù)失敗。?
垃圾,無(wú)法生成ppt也就算了,只給出了一張圖
片算是怎么回事? Comet執(zhí)行結(jié)果:
失敗
鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28測(cè)試感受(人寫)?
任務(wù)成功。?
給了5到7天的巴黎之旅規(guī)劃,不僅涵蓋了各大景
點(diǎn),還有美食、出行、語(yǔ)言文化、安全等建議,每處景點(diǎn)都有開(kāi)放時(shí)間、門票價(jià)格、小貼士,是最詳細(xì)的一個(gè)Manus還是太全面了。?
但是全面歸全面,由于信息太多更應(yīng)該注意圖文
排版和色彩搭配,配色是藕粉色搭配金黃色,很土而且藕粉色背景就看不清金黃色圖標(biāo)了目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|50制作巴黎旅行PPT
ManusManus執(zhí)行結(jié)果:
成功鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|51制作巴黎旅行PPT-Genspark測(cè)試感受(人寫)?
任務(wù)成功。?
使用的AI幻燈片模式,給出了巴黎4天3夜旅行
規(guī)劃,涵蓋了各大必去景點(diǎn)和體驗(yàn)美食的規(guī)劃還包括住行的建議,圖文排版配色字體很和諧,主
觀的評(píng)價(jià)是3個(gè)當(dāng)中最好看的。?
可惜最后一頁(yè)的背景圖沒(méi)有顯示出來(lái),可以向AI
再提要求讓AI修改,所以也沒(méi)什么問(wèn)題。Genspark執(zhí)行結(jié)果:
成功鏈接圖片來(lái)自測(cè)試界面截圖,
PPT鏈接2025/7/28紐約租房PPT目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|52紐約租房PPT2025/7/28Prompt:I'ma
realtor
helping
myclientJohn,acreative
director
and
interior
design
enthusiast,finda
2-bedroomrental
in
NewYorkCity.
He's
lookingforanapartmentwitha
spacious
layout,eclecticordesign-forward
interior,accesstosportsfacilities
and
aswimming
pool,andgoodconnectivityto
Manhattan
(ideallywithin
30
minutes).His
budget
is
upto
$5000
USD/month.Use
reputable
rental
listing
platformstofindtopoptions,Thencreate
apersonalized
pitchdecktailoredtoJohn's
profile
-
highlight
uniquefeatures,visualappeal,
neighborhoodvibe,andwhyeach
propertywould
resonatewith
hiscreative
lifestyle難度等級(jí):高級(jí)任務(wù)來(lái)源:
ManusAI(@ManusAI_HQ)/ManusAI_HQ/status/1947672991455973486任務(wù)難度:4.2任務(wù)分析:涉及搜索、
PPT生成目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|53紐約租房PPT2025/7/28產(chǎn)品完成時(shí)間(s)測(cè)試結(jié)果(人工評(píng)價(jià))相關(guān)鏈接OpenAIAgent2940部分成功對(duì)話鏈接
PPT鏈接Perp
Comet35失敗對(duì)話鏈接Manus540失敗對(duì)話鏈接Genspark360部分成功對(duì)話鏈接
PPT鏈接Prompt:
I'ma
realtor
helpingmyclientJohn,acreative
directorand
interior
design
enthusiast,
find
a
2-bedroomrental
in
NewYorkCity.
He'slookingforanapartmentwitha
spacious
layout,
eclectic
or
design-forward
interior,
access
to
sports
facilities
and
a
swimming
pool,andgoodconnectivityto
Manhattan
(ideallywithin
30
minutes).Hisbudgetis
upto
$5000
USD/month.Use
reputablerental
listing
platformstofindtopoptions,Thencreatea
personalized
pitch
decktailored
toJohn's
profile
-
highlight
uniquefeatures,visualappeal,
neighborhoodvibe,andwhyeach
propertywouldresonatewith
hiscreative
lifestyle紐約租房PPT
耗時(shí)&結(jié)果目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|542025/7/28紐約租房PPT
測(cè)試結(jié)果
AI分析結(jié)果目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|55鏈接鏈接鏈接鏈接2025/7/28測(cè)試感受(人寫)?
任務(wù)部分成功。?
用時(shí)太長(zhǎng)了,實(shí)在太慢了,49分鐘產(chǎn)出的PPT是
什么樣子呢??
打開(kāi)發(fā)現(xiàn)房屋圖片是AI生成的,嚴(yán)重降低了此
PPT的實(shí)用性,甚至?xí)`導(dǎo)用戶。?
而文字部分是真實(shí)房源,點(diǎn)擊分析過(guò)程的鏈接可
以看到對(duì)應(yīng)的房源實(shí)拍圖。希望能抓取實(shí)拍圖放到PPT中。目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|56紐約租房PPT-openAIAgent OpenAI
Agent執(zhí)行結(jié)果:
部分成功鏈接圖片來(lái)自測(cè)試界面截圖,
PPT鏈接2025/7/28目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|57紐約租房PPT
Comet測(cè)試感受(人寫)?
任務(wù)失敗。?
無(wú)法生成ppt,也沒(méi)有給出任何圖例。如果只是
文字性信息,你和claude有什么區(qū)別 Comet執(zhí)行結(jié)果:
失敗
鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28測(cè)試感受(人寫)?
任務(wù)失敗。?
僅找到了1個(gè)合適的房源,和幾個(gè)推薦的社區(qū),
分析了社區(qū)的優(yōu)缺點(diǎn),各種圖表特別專業(yè),
PPT
也很好看,這次PPT配色圖文編排都特別好看。?
但是PPT中沒(méi)有給出對(duì)應(yīng)的聯(lián)系方式或網(wǎng)站鏈接,
即使John相中了房子也沒(méi)法直接聯(lián)系租到,沒(méi)什么實(shí)際用處目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|58紐約租房PPT
ManusManus執(zhí)行結(jié)果:
失敗
鏈接圖片來(lái)自測(cè)試界面截圖2025/7/28目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|59紐約租房PPT-Genspark測(cè)試感受(人寫)?
任務(wù)部分成功。?
分析了幾個(gè)房源網(wǎng)站,找到了合適的房源,和幾
個(gè)推薦的社區(qū),分析了優(yōu)缺點(diǎn)。?
但是PPT中沒(méi)有給出對(duì)應(yīng)的聯(lián)系方式或網(wǎng)站鏈接,
即使John相中了房子也沒(méi)法直接聯(lián)系租到,沒(méi)什么實(shí)際用處 Genspark執(zhí)行結(jié)果:
部分成功
鏈接圖片來(lái)自測(cè)試界面截圖,
PPT鏈接2025/7/28LLM產(chǎn)業(yè)報(bào)告+PPTLLM產(chǎn)業(yè)報(bào)告+PPT目錄
|作者
|測(cè)試感受
|難度分級(jí)說(shuō)明
|金融
|市場(chǎng)
|
教育
|其他
|結(jié)尾
|附件
aiwatch.ai
|602025/7/28Prompt:調(diào)查所有LLM的數(shù)據(jù)和信息,撰寫一篇面向AI
startup的LLM深度
研究報(bào)告,設(shè)計(jì)并建構(gòu)2級(jí)、
3級(jí)指標(biāo)并對(duì)其性能和參數(shù)進(jìn)行量化分
析,最后對(duì)整個(gè)AI產(chǎn)業(yè)從2022年至今的模型演化制作一個(gè)演講PPT,
向團(tuán)隊(duì)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 山東省百師聯(lián)盟2024-2025學(xué)年高二下學(xué)期6月聯(lián)考地理試題(解析版)
- 遼寧省重點(diǎn)高中沈陽(yáng)市郊聯(lián)體2024-2025學(xué)年高三上學(xué)期10月月考地理試題(解析版)
- 2025年合肥市口腔醫(yī)院引進(jìn)高層次人才10人模擬試卷及一套完整答案詳解
- 倡導(dǎo)健康生活行為規(guī)范承諾書(8篇)
- 員工培訓(xùn)課程表
- 2025國(guó)家自然科學(xué)基金委員會(huì)公開(kāi)選聘流動(dòng)編制10人模擬試卷及完整答案詳解
- 2025年廈門市供電服務(wù)有限公司招聘12人考前自測(cè)高頻考點(diǎn)模擬試題及完整答案詳解一套
- 2025年浙江大學(xué)醫(yī)學(xué)院附屬第二醫(yī)院招聘心電圖室工作人員若干人考前自測(cè)高頻考點(diǎn)模擬試題及答案詳解(名師系列)
- 2025遼寧錦州醫(yī)科大學(xué)開(kāi)展“錦醫(yī)英才計(jì)劃”醫(yī)學(xué)名家遴選考前自測(cè)高頻考點(diǎn)模擬試題參考答案詳解
- 2025年上海奉賢區(qū)教育系統(tǒng)事業(yè)單位編外用工招聘143名模擬試卷含答案詳解
- 2022智慧園區(qū)設(shè)計(jì)、建設(shè)與驗(yàn)收技術(shù)規(guī)范
- 自備車補(bǔ)貼申請(qǐng)表
- 信息論與編碼(第4版)完整全套課件
- 汽修廠安全風(fēng)險(xiǎn)分級(jí)管控清單
- GB/T 2679.7-2005紙板戳穿強(qiáng)度的測(cè)定
- GB/T 25840-2010規(guī)定電氣設(shè)備部件(特別是接線端子)允許溫升的導(dǎo)則
- GB/T 25146-2010工業(yè)設(shè)備化學(xué)清洗質(zhì)量驗(yàn)收規(guī)范
- 參考資深同傳
- 多功能注氧儀說(shuō)明書課件
- 科隆電磁流量計(jì)培訓(xùn)課件
- 全集舉一反三課件奧數(shù)五年級(jí)(數(shù)學(xué))
評(píng)論
0/150
提交評(píng)論