chatgpt 抓取网站数据 【第五届RPA极客挑战赛】赛题三:打造可以联网的ChatGPT搜索助手
【第五届RPA极客挑战赛】结束后很多未参与的伙伴留言对赛题设置很感兴趣,赛题结合当前爆火的、大语言模型技术热点,共设置、、“打造可以联网的搜索助手”三道题目。我们将在公众号以文章形式发布详细的赛题说明,供大家参阅。
赛题3:打造可以联网的搜索助手(45分)
一、赛题背景
在当今信息爆炸的时代,大量的知识和数据被广泛分布在互联网上。对于大语言模型(如GPT)这样的强大工具,赋予其可以上网搜索数据的能力将极大地提升其实用性和智能化程度。这种能力的结合可以为用户提供更加全面准确的信息,并且有效地应用于各种场景,如数据分析、自动化任务等。因此,本届RPA黑客松挑战赛设置了这样一个赛题,旨在为GPT结合RPA抓取功能,使其具备上网搜索数据的能力。
现实意义:
提升信息获取效率:GPT结合RPA抓取功能可以自动化地从互联网上获取信息,无需人工手动搜索,大大提高了信息获取的效率。
增强数据分析能力:通过上网搜索数据,GPT可以获取更全面准确的信息来进行数据分析,从而提供更有价值的洞察和决策支持。
自动化任务执行:结合RPA抓取功能,GPT可以自动化执行特定任务,并根据搜索结果进行进一步处理,从而减轻人工工作负担。
个性化服务提供:基于上网搜索数据的能力,GPT可以根据用户需求提供个性化的服务,如搜索新闻、查看天气或预定机票和酒店等。
二、赛题流程描述
1.(RPA)读取输入名为 的表格chatgpt 抓取网站数据,遍历表格内的所有问题();
2.(RPA)RPA打开浏览器通过搜索引擎搜索关键字并获得结果的索引list;
3.(RPA)遍历索引list,并获取对应索引中的页面的正文文本数据(一般为p标签内的文本),并保存、url以及网页文本数据,到第一步中的文件中,新建名称与问题名字保持一致;
4.将文本数据发送给chatgpt 抓取网站数据,通过构建合适的提示词,询问是否包含该问题()的答案,如果包含,则进行下一个问题,如果不包含,则遍历下一个返回的索引页面;
5.(RPA)把问题答案保存到步骤1中的文件中的列中。
6(手动)上传文件和录屏文件到竞赛系统
三、赛题帮助和文件要求说明
1.获取页面有用的内容chatgpt 抓取网站数据,可以尝试在body标签下的所有的
标签中获取(一般情况下)
2.构建合适的提示词,通过给到内容来咨询是否包含答案,注意要对答案进行判断是否包含,让RPA机器人可以有一个确切的循环判断条件。
四、分数说明
本赛题共计45分
五、赛题数据包下载
在公众号后台回复“数据包3”,可下载本道赛题的数据包。
报告下载
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表本站的观点和立场和对其真实性负责。如需转载,请联系原作者。如果来源标注有误或侵犯了您的合法权益或者其他问题不想在本站发布,来信即删。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。