关注

大模型LLM ACA - ACP认证考试模拟试卷八

目录

 一、大模型LLM ACA - ACP认证考试

二、大模型LLM ACA - ACP认证考试模拟试卷

(一)单选题:70 题 × 1 分 = 70 分

1. 以下描述中错误的是?

2. 下面是qwen2.5-1.5b 微调训练过程中的损失趋势图,当前的状态是?

3. RAG 应用在处理 IT 技术文档时表现不错,但在公司内部人事流程的问答中经常答非所问。最先应该检查哪方面?

4. 在以下代码片段中,system_message的作用是什么?

5. 准备业务领域相关数据集时,以下哪个步骤对于确保微调效果至关重要?

6. 在大模型的问答工作流程中,哪个阶段会循环生成候选Token直到输出结束标记?

7. 在批量处理上万个问卷的过程中,大模型API相比传统的人工处理方式,最大的优势是什么?

8. 在 Ragas 中,context recall 指标的主要作用是什么?

9. 如何获取大模型返回信息的文本内容?

10. 在RAG应用的多轮对话中,为什么不能直接将完整历史对话与问题输入到检索系统?

11. 分词(Tokenization)的主要作用是什么?

12. 在代码中,OpenAILike 类的主要作用是什么?

13. 下列哪一项不属于大语言模型微调可能带来的挑战?

14. 在构建 RAG 应用时,以下哪种向量存储方案适合小规模应用?

15. 在 qwen2.5-1.5b 模型微调时,训练损失和验证损失在同时快速下降,以下说法正确的是?

16. 在构建大语言模型RAG应用过程中,向量数据库的主要作用是什么?

17. 下列选项中,哪一项最符合大语言模型微调的主要目的?

18. 你维护了一个开发者社区的大模型问答助手,但你发现有人通过上传一些恶意的文章,诱导大模型生成恶意代码。从长期防护角度,最根本的解决措施是?

19. 在训练大模型时,为防止信息泄露,可以采取的有效措施是?

20. 在 context recall 的计算过程中,以下哪些是 ground_truth 观点列表的生成依据?

21. 在 RAGAS 评分之后,你对其中一些指标有些疑问,你可以查看哪个字段来追溯大模型评分的原因?

22. 以下哪种情况更适合使用代码解释器插件而不是直接使用大模型?

23. 关于如下代码的解释中,正确的是哪一项?

24. 在创建一个消息(Message)时,需要传递哪个参数来指定线程 ID?

25. 在构建 RAG 应用时,以下哪种向量存储方案适合开发测试?

26. 在构建 RAG 应用时,以下哪种向量存储方案适合快速开发和测试?

27. 小明创建了一个基于他们公司内部制度文件的RAG应用,他以下的哪些问题可能得不到正确答案?

28. 在优化 context recall 指标时,以下哪种方法可以确保知识库内容完备?

29. 在文档切片过程中,以下哪种切片方法根据语义相关性自适应地选择切片点?

30. 在优化 answer correctness 指标时,以下哪些是优化 prompt 的好处?

31. 在检测文档内容中是否存在营销性表达时,下列哪种方法可以更全面地识别问题?

32. 如果要修改摘要生成函数,使其生成的摘要不超过 80 个字,应该如何修改?

33. RAG应用的文本合规检查过程中,使用规则匹配方法的主要缺点是什么?

34. 在优化 context recall 指标时,以下哪种方法可以提升召回的准确率?

35. 在斯坦福小镇多智能体社区研究项目中,智能体间的主要互动模式是什么?

36. 以下哪种方式不符合"Multi - Agent"的处理思想?

37. 以下哪种文档切片方法能够更好地保持句子的完整性?

38. 为了加强大语言模型生成内容的信任机制,哪项措施最具有效果?

39. 某公司更新了组织架构,但知识库还是旧文档,查询结果经常过时。为避免回答陈旧信息,最合适的方式是?

40. 在检索召回阶段,以下哪些方法结合用户信息、行为等数据扩写问题?

41. 在调用大语言模型对话的API过程中,如果要修改生成摘要的函数,使其生成的摘要不超过80个字,应该如何修改?

42. 在文档解析与切片阶段,以下哪种情况会影响大模型的回答效果?

43. 优化后的答疑机器人为什么不需要每次提问都经过RAG链路?

44. 以下哪种方法不属于常见的文档切片方法?

45. 在以下代码片段中,display(evaluate_result(question, response, ground_truth))的作用是什么?

46. 你在优化 RAG应用时,检索条件改得非常宽松,相似度很低的文本段也可以被召回。这可能会导致出现以下哪种情况

47. 在一个电商问答系统中,用户提问 “百炼 X1 手机的电池容量是多少?” 后又问 “充电器支持快充吗?”。如果直接用第二轮的问题进行检索,可能会出现什么现象?

48. 在文档切片过程中,以下哪种切片方法适合处理逻辑性强、内容专业的文档?

49. 你在开发公司内部制度问答机器人时,将所有制度文件都输入到大模型中,导致输入超长报错,应优先采用哪种方案?

50. 关于业务领域相关数据集的准备,以下哪种做法可能会导致微调效果不佳?

51. 在文本向量化过程中,embedding模型的主要作用是什么?

52. 在大模型应用备案的过程中,未完成合规手续的应用将会面临什么样的处理措施?

53. 你让大模型为科技新闻生成标题,但输出标题过于平淡(如“某公司发布新产品”)。以下哪种方法,更有助于生成你想要的标题:

54. 以下关于基于规则的文本合规检查方法的描述,哪一项是不正确的?

55. Ragas 提供的以下哪些指标用于评估生成答案与问题的相关性?

56. 你希望你所构建的大模型客服应用能保障合规性的同时,也要确保用户使用体验,以下哪个技术方案更可靠且不明显影响体验?

57. 在自定义提示词模板中,以下哪项是用于处理涉及隐私问题的注意事项?

58. 你使用 Qwen-Max 生成了课程内容,现在需要将其转换为 Marp 格式的 Markdown。以下哪个 Qwen-Max 的提示词最有效

59. 小明在创建RAG应用时,知识库配置部分的相似度阈值设置较高,在应用创建界面设置检索片段数为5,进行提问时检索到高于相似度阈值的文本块只有3个,最后实际召回的文本块有几个?

60. 在RAG应用中,建立索引阶段包括以下哪些步骤?

61. 向量检索召回了10条切片,但部分切片与问题相关度很低,干扰了大模型答案。哪种方式能更好地过滤掉低相关度切片?

62. 下列描述中,最符合大语言模型预训练与微调之间关系的是哪一项?

63. Ragas 提供的 Answer Relevancy 指标用于评估什么?

64. ModelScope-Agent的核心优势之一是其高度的可定制性,这主要得益于其

65. 在优化 answer correctness 指标时,以下哪些是调整大模型生成超参数(如 temperature)的好处?

66. 自然语言处理(NLP)任务中,为什么需要对文本进行分词化?

67. 在检索召回阶段,以下哪些方法提取标签用于后续标签过滤+向量相似度检索?

68. 在大模型应用系统中,为了缓解有限长上下文问题,下列哪项措施不是通常采用的方法?

69. 以下代码片段的作用是什么?os.environ ["OPENAI_API_KEY"]="your-api-key-here"

70. 小王开发了一个AI音乐创作工具,在用户协议中声明对用户使用该工具创作的音乐作品享有所有权。这种做法是否合规?

(二)多选题:30 题 × 1 分 = 30 分

1. 你通过RAG为用户提供商品推荐服务。用户反馈说,在搜索“包子”时,推荐结果中经常出现”书包”的商品信息。后台分析发现,召回阶段确实会夹杂部分无关商品的信息。以下哪些措施能够有效提升该系统的推荐效果?

2. 在RAG应用的检索与生成阶段,主要优势包括哪些?

3. 在文档切片过程中,以下哪些切片方法适合处理长文档且需要保持上下文?

4. 在提取标签的过程中,以下哪些标签类型是支持的?

5. 在检索召回阶段,以下哪些方法用于在检索后减少无关信息?

6. 以下哪些情况可能导致大模型检索不准确?

7. 在构建 RAG 应用时,大模型可以用于哪些其他应用场景?

8. 在加载本地索引文件时,以下哪些参数可以设置?

9. Ragas 提供的以下哪些指标用于评估生成环节?

10. 在使用大模型提炼图文课程内容时,以下哪些指导原则是正确的?

11. 下列哪些因素会影响大语言模型微调的效果?

12. 在问题改写中,以下哪些方法通过大模型生成更完整的问题?

13. 在 Ragas 中,以下哪些指标用于评估检索召回效果?

14. 关于多模态技术底层原理,正确的说法是?

15. 在构建 RAG 应用时,以下哪些是云服务向量存储的特点?

16. GraphRAG 技术的优势包括哪些?

17. RAG 应用在检索时共召回了 10 条切片,其中 3 条高度相关,但 3 条内容都来自相邻段落,却被系统拆分成不同切片,从而导致回答时缺失连贯的上下文信息。哪些方案可进一步提升答案准确度?

18. 你写了一个提示词“请用适合简报的形式,以每篇100字的篇幅总结今早的十大新闻”,你希望大模型能按照提示词完成任务,以下哪些方案可行?

19. 关于 Qwen-Max、CosyVoice 和 moviepy 的协同使用,以下哪些说法是正确的?

20. Assistant API 的 Assistant 类的各项功能中涵盖了以下哪些操作?

21. 在切片向量化与存储阶段,以下哪些是余弦相似度的计算方法?

22. 实现早停法(early stopping)策略时,考虑的条件可能包括:

23. 在切片向量化与存储阶段,以下哪些是 compare_embedding_models 函数的参数?

24. APIAssistantAgent 示例代码 query 函数中,哪些步骤与大语言模型交互?

25. 在以下代码片段中,哪些参数可以影响生成文本的多样性?

26. 在示例中,以下哪些是提示词中规定的输出要求?

27. 在 context precision 的计算过程中,以下哪些是判断 contexti 是否相关的依据?

28. 在检索召回阶段,以下哪些方法通过增加更多信息让检索结果更全面?

29. 关于 temperature 和 top_p 参数的作用,以下哪三个描述是正确的?

30. 如果将 RAG 与开卷考试相类比,下列哪两项描述最符合它们的相同之处?


一、大模型LLM ACA - ACP认证考试

探索未来智能的钥匙——ACA-ACP大模型工程师认证专栏导读 (含十套模拟真题和真题精选)

请认真阅读考试须知后,准备好相关资料开始进行防作弊验证。验证通过后将正式开始考试。

答题开始即开始计时,中途不可暂停,如超时则自动提交

1、考试共 (100) 道题,总分100分,及格分数80分。(模拟试题库对应模拟试题按70:30-单选题-多选题,真题一般50:25
2、考试需在(120分钟)内交卷,过程中无法暂停,请提前安排好时间;如未及时交卷,则本次考试作废
3、推荐使用 Chrome 浏览器(版本:73及以上的正式版本),或Firefox浏览器(版本:66及以上的正式版本)
4、开始答题前会进行身份验证,需要您拍摄并上传身份证人像面照片,并按照系统要求开启摄像头进行面部识别
5、考试过程中请保持摄像头开启并对准面部,系统会不定时进行抓拍,并与身份证照片做对比,如发现作弊行为,您的考试成绩将作废
6、考试过程中,系统将判断您的浏览器状态,如发现最小化浏览器、切换标签页、窗口缩小或扩大等行为,以及弹出广告弹窗,将会给出警告。如果次数过多您的考试成绩将作废
7、考试前请关闭即时通信软件以及其他可能会有弹窗的软件,以免影响您的考试

祝大家一次上岸,顺利拿证!未来在云赛道上,越走越宽、越走越远 ✨

二、大模型LLM ACA - ACP认证考试模拟试卷

(一)单选题70 题 × 1 分 = 70 分

1. 以下描述中错误的是?

A. 优秀的基础模型(大模型)只需要自身庞大的参数规模和计算硬件,对数据量没有太大要求 

B. 小明希望做一个企业专有的知识库工程,他可以在基座模型上用微调的形式来实现 

C. 生成式人工智能是机器学习中快速增长的子集

2. 下面是qwen2.5-1.5b 微调训练过程中的损失趋势图,当前的状态是?

A. 欠拟合

B. 过拟合

C. 训练失败

3. RAG 应用在处理 IT 技术文档时表现不错,但在公司内部人事流程的问答中经常答非所问。最先应该检查哪方面?

A. 问题必须拆成多次检索

B. 大模型温度过高

C. 是否缺少人事流程相关文档或索引

D. 大模型计算资源不足

4. 在以下代码片段中,system_message的作用是什么?

A. 定义标签提取的规则和输出格式

B. 定义用户输入的格式

C. 定义模型训练的参数

5. 准备业务领域相关数据集时,以下哪个步骤对于确保微调效果至关重要?

A. 对数据进行无偏见的随机排序

B. 执行数据清洗以去除噪声和不一致性

C. 将全部数据划分为训练集、验证集和测试集

6. 在大模型的问答工作流程中,哪个阶段会循环生成候选Token直到输出结束标记?

A. 输入文本分词化

B. Token向量化

C. 大模型推理

D. 自回归解码

7. 在批量处理上万个问卷的过程中,大模型API相比传统的人工处理方式,最大的优势是什么?

A. 处理速度慢,但准确率极高

B. 需要大量人力物力投入

C. 能够保持高度一致性和效率,同时处理大量数据

8. 在 Ragas 中,context recall 指标的主要作用是什么?

A. 评估 RA应用在检索阶段的表现

B. 评估生成答案的准确度

C. 增加模型的训练数据

9. 如何获取大模型返回信息的文本内容?

A. completion.choices[0]

B. completion.message.content

C. completion.choices[0].message.content

D. completion.choices.content

10. 在RAG应用的多轮对话中,为什么不能直接将完整历史对话与问题输入到检索系统?

A. 检索系统无法处理长文本

B. 检索速度变慢

C. 模型无法理解用户输入

11. 分词(Tokenization)的主要作用是什么?

A. 将文本转换为固定长度的向量

B. 将输入文本分割成单词、子词或字符等更小的语义单元

C. 提取文本的语义特征以计算情感值

12. 在代码中,OpenAILike 类的主要作用是什么?

A. 加载大模型

B. 增加模型的训练数据

C. 减少模型的推理时间

13. 下列哪一项不属于大语言模型微调可能带来的挑战?

A. 需要足够高质量的特定领域数据

B. 微调过程可能引入偏见

C. 模型大小和复杂度降低

D. 过拟合特定任务,泛化能力下降

14. 在构建 RAG 应用时,以下哪种向量存储方案适合小规模应用?

A. 本地向量数据库

B. 内存向量存储

C. 云服务向量存储

15. 在 qwen2.5-1.5b 模型微调时,训练损失和验证损失在同时快速下降,以下说法正确的是?

A. 说明模型已收敛,可停止训练

B. 说明模型开始过拟合,需立即停止

C. 说明学习率设置过高,需调小

D. 说明训练策略有效,应继续训练

16. 在构建大语言模型RAG应用过程中,向量数据库的主要作用是什么?

A. 存储和管理大量的图像数据

B. 存储和管理大量的文本数据,并提供全文检索功能

C. 存储和管理大量的向量数据

17. 下列选项中,哪一项最符合大语言模型微调的主要目的?

A. 提升模型的泛化能力

B. 减少模型的参数量

C. 改善模型在特定任务上的性能

18. 你维护了一个开发者社区的大模型问答助手,但你发现有人通过上传一些恶意的文章,诱导大模型生成恶意代码。从长期防护角度,最根本的解决措施是?

A. 输出阶段调用代码静态分析工具

B. 在知识库上传阶段扫描文档安全性

C. 限制模型生成可执行代码

D. 为知识库文档添加数字签名

19. 在训练大模型时,为防止信息泄露,可以采取的有效措施是?

A. 数据混杂处理

B. 数据匿名化处理

C. 使用虛拟数据

20. 在 context recall 的计算过程中,以下哪些是 ground_truth 观点列表的生成依据?

A. ground_truth

B. contexts

C. 增加模型的训练数据

21. 在 RAGAS 评分之后,你对其中一些指标有些疑问,你可以查看哪个字段来追溯大模型评分的原因?

A. source

B. reason

C. json_object

D. source_node

22. 以下哪种情况更适合使用代码解释器插件而不是直接使用大模型?

A. 将一组文档按主题分类

B. 分析一段文本的情感

C. 从用户评论中提取关键信息

D. 计算两组数据之间的皮尔逊相关系数

23. 关于如下代码的解释中,正确的是哪一项?

A. 基于已有thread创建运行任务,使用流式输出

B. 基于已有thread创建运行任务,使用非流式输出

C. 创建thread并运行任务

24. 在创建一个消息(Message)时,需要传递哪个参数来指定线程 ID?

A. thread.id

B. message.id

C. content

D. assistant.id

25. 在构建 RAG 应用时,以下哪种向量存储方案适合开发测试?

A. 内存向量存储

B. 本地向量数据库

C. 云服务向量存储

26. 在构建 RAG 应用时,以下哪种向量存储方案适合快速开发和测试?

A. 内存向量存储

B. 本地向量数据库

C. 云服务向量存储

27. 小明创建了一个基于他们公司内部制度文件的RAG应用,他以下的哪些问题可能得不到正确答案?

A. 如果我要请病假,工资是怎么扣的?

B. 公司的薪酬制度是怎么样的?

C. 我如果迟到了,公司会有什么处罚制度?

D. 公司去年的财务报表数据是多少?

28. 在优化 context recall 指标时,以下哪种方法可以确保知识库内容完备?

A. 对比知识库内容与测试样本

B. 增加模型的训练数据

C. 减少模型的推理时间

29. 在文档切片过程中,以下哪种切片方法根据语义相关性自适应地选择切片点?

A. 语义切片

B. Token 切片

C. 句子切片

30. 在优化 answer correctness 指标时,以下哪些是优化 prompt 的好处?

A. 提升生成答案的准确度

B. 增加模型的训练数据

C. 减少模型的推理时间

31. 在检测文档内容中是否存在营销性表达时,下列哪种方法可以更全面地识别问题?

A. 识别所有内容错误的部分

B. 让大模型自动修改内容

C. 逐条单独识别营销词汇

D. 一次性生成所有类型的识别结果

32. 如果要修改摘要生成函数,使其生成的摘要不超过 80 个字,应该如何修改?

A. 假设生成结果为 query,生成结果后添加 query=query [:80]。

B. 以上修改方法均不正确。

C. 在提示词部分明确写出摘要本身的内容不超过 80 个字。

D. 假设输入的文档为 document,在函数开头添加

33. RAG应用的文本合规检查过程中,使用规则匹配方法的主要缺点是什么?

A. 计算复杂度高,处理速度慢

B. 需要大量的训练数据

C. 缺乏泛化能力

34. 在优化 context recall 指标时,以下哪种方法可以提升召回的准确率?

A. 使用大模型改写 query

B. 增加模型的训练数据

C. 减少模型的推理时间

35. 在斯坦福小镇多智能体社区研究项目中,智能体间的主要互动模式是什么?

A. 所有智能体同时参与的大会讨论

B. 仅限于两两之间的频繁沟通

C. 由中心控制器统一调度,无需直接沟通

D. 基于社交网络的分布式交互,支持一对多、多对一和多对多的灵活沟通

36. 以下哪种方式不符合"Multi - Agent"的处理思想?

A. 将文档的标题改写、表格单元格改写和语义分割都交给同一个大模型一次性完成。

B. 使用 DashScopeParse 解析文档结构,再使用通义千问 API 润色文本。

C. 使用规则引擎处理简单的文本格式转换,使用大模型处理复杂的语义理解任务。

D. 根据不同的子任务需求,选择不同的模型类型和参数。

37. 以下哪种文档切片方法能够更好地保持句子的完整性?

A. 基于语义的切片,通过 markdown 文档结构进行

B. 基于句子的切片

C. 随机切片

D. 基于语义的切片,通过嵌入模型计算语义断点

E. 基于字符切片

F. 基于固定 token 长度切片

38. 为了加强大语言模型生成内容的信任机制,哪项措施最具有效果?

A. 提高模型参数

B. 增加训练轮数

C. 添加AIGC声明

39. 某公司更新了组织架构,但知识库还是旧文档,查询结果经常过时。为避免回答陈旧信息,最合适的方式是?

A. 定期同步最新文档并重建索引

B. 调整 Node Parser 切片长度

C. 对旧知识不做任何处理

D. 增大模型温度让其自由生成

40. 在检索召回阶段,以下哪些方法结合用户信息、行为等数据扩写问题?

A. 基于用户画像扩展上下文

B. 问题改写

C. 重排序

41. 在调用大语言模型对话的API过程中,如果要修改生成摘要的函数,使其生成的摘要不超过80个字,应该如何修改?

A. 在提示词部分明确写出摘要本身的内容不超过80个字

B. 假设生成结果为query,生成结果后添加query = query[:80]

C. 假设输入的文档为document

42. 在文档解析与切片阶段,以下哪种情况会影响大模型的回答效果?

A. 文档切片缺少关键信息

B. 增加模型的训练数据

C. 减少模型的推理时间

43. 优化后的答疑机器人为什么不需要每次提问都经过RAG链路?

A. 节省资源并避免知识库信息干扰大模型推理

B. 增加模型的训练数据

C. 减少模型的推理时间

44. 以下哪种方法不属于常见的文档切片方法?

A. 按词性分割

B. 按 token 长度分割

C. 按语义分割

D. 按字符分割

45. 在以下代码片段中,display(evaluate_result(question, response, ground_truth))的作用是什么?

A. 显示评估结果

B. 设置召回切片的最大数量

C. 设置重排序的切片数量

46. 你在优化 RAG应用时,检索条件改得非常宽松,相似度很低的文本段也可以被召回。这可能会导致出现以下哪种情况

A. Context Recall(文本段召回率)变高

B. Context Recall(文本段召回率)变低

C. Context Recall(文本段召回率)基本不变

47. 在一个电商问答系统中,用户提问 “百炼 X1 手机的电池容量是多少?” 后又问 “充电器支持快充吗?”。如果直接用第二轮的问题进行检索,可能会出现什么现象?

A. 由于 embedding 擅长处理短文本,因此检索结果更为精确

B. embedding 模型不擅长处理短文本,导致检索精度下降

C. 向量数据库自带上下文记忆功能,可以准确判断第二轮的问题是关于 “百炼 X1 手机” 的

D. 检索结果不准确,丢失 “百炼 X1 手机” 这一历史对话信息

48. 在文档切片过程中,以下哪种切片方法适合处理逻辑性强、内容专业的文档?

A. 语义切片

B. Token 切片

C. 句子切片

49. 你在开发公司内部制度问答机器人时,将所有制度文件都输入到大模型中,导致输入超长报错,应优先采用哪种方案?

A. 使用 RAG,检索最相关的文本段后再输入到大模型

B. 增加生成 Token 的数量

C. 降低 temperature 值

D. 通过参数调大模型的最大输入长度

50. 关于业务领域相关数据集的准备,以下哪种做法可能会导致微调效果不佳?

A. 数据集包含丰富多样的任务相关示例

B. 对数据进行清洗,去除噪声和无关信息

C. 使用大量无标注数据进行半监督学习

51. 在文本向量化过程中,embedding模型的主要作用是什么?

A. 将自然语言转化为计算机能够理解的数字形式

B. 增加模型的训练数据

C. 减少模型的推理时间

52. 在大模型应用备案的过程中,未完成合规手续的应用将会面临什么样的处理措施?

A. 数据删除

B. 服务降级

C. 应用下架

53. 你让大模型为科技新闻生成标题,但输出标题过于平淡(如“某公司发布新产品”)。以下哪种方法,更有助于生成你想要的标题:

A. 调整输出格式:要求标题全部大写

B. 通过多轮对话,明确告诉大模型不满意:“我觉得不好,再改改”

C. 先增加上下文,补充产品关键信息,如果不好再会尝试增加一些样例

D. 补充新闻稿中的发布会日期、会场地址和与会者人数

54. 以下关于基于规则的文本合规检查方法的描述,哪一项是不正确的?

A. 对于特定高风险场景效果显著。

B. 需要维护一个规则库,例如包含正则表达式、敏感词或模式。

C. 规则更新可能不及时,人工维护成本较高。

D. 具有很强的数据泛化能力,可以有效识别新的变种。

55. Ragas 提供的以下哪些指标用于评估生成答案与问题的相关性?

A. Answer Relevancy

B. Faithfulness

C. Context Precision

56. 你希望你所构建的大模型客服应用能保障合规性的同时,也要确保用户使用体验,以下哪个技术方案更可靠且不明显影响体验?

A. 在大模型生成答案后,使用正则表达式过滤器,检测并替换敏感关键词

B. 结合内容安全服务,对大模型流式输出实施实时合规扫描,违规片段内容进行替换

C. 基于关键词实时匹配触发拦截机制,高危内容直接终止响应并提示用户

D. 部署混合模型架构:大模型生成回答后,立即调用专用小模型进行合规性重写

57. 在自定义提示词模板中,以下哪项是用于处理涉及隐私问题的注意事项?

A. 提醒用户问题触及安全红线,无法提供

B. 增加模型的训练数据

C. 减少模型的推理时间

58. 你使用 Qwen-Max 生成了课程内容,现在需要将其转换为 Marp 格式的 Markdown。以下哪个 Qwen-Max 的提示词最有效

A. 把这些内容转换成 Markdown

B. 用 Markdown 写个幻灯片

C. 将以下内容转换为适合 Marp 幻灯片演示的 Markdown 格式,并包含标题、列表和代码块等元素。

D. “帮我转换成 PPT”

59. 小明在创建RAG应用时,知识库配置部分的相似度阈值设置较高,在应用创建界面设置检索片段数为5,进行提问时检索到高于相似度阈值的文本块只有3个,最后实际召回的文本块有几个?

A. 2

B. 3

C. 4

60. 在RAG应用中,建立索引阶段包括以下哪些步骤?

A. 文档解析、文本分段、文本向量化、存储索引

B. 文档解析、文本向量化、检索、生成

C. 文本分段、文本向量化、检索、生成

61. 向量检索召回了10条切片,但部分切片与问题相关度很低,干扰了大模型答案。哪种方式能更好地过滤掉低相关度切片?

A. 简单把生成结果截断

B. 使用高温度的模型进行生成

C. 结合文本重排序模型(ReRank)并只保留 Top N

D. 在大模型回答后再次让用户手动删除

62. 下列描述中,最符合大语言模型预训练与微调之间关系的是哪一项?

A. 微调是预训练模型过程中的初次训练

B. 预训练和微调是相互独立的过程

C. 微调是在预训练模型基础上进行的调整优化

63. Ragas 提供的 Answer Relevancy 指标用于评估什么?

A. 生成答案与问题的相关性

B. RAG 应用生成答案的准确度

64. ModelScope-Agent的核心优势之一是其高度的可定制性,这主要得益于其

A. 强大的预训练模型阵容,直接提供最优性能无需调整

B. 简化的Agent实现流程,允许用户仅通过指定角色描述等基本信息即可快速搭建应用

C. 限制性的接口设计,确保了所有组件的严格一致性

65. 在优化 answer correctness 指标时,以下哪些是调整大模型生成超参数(如 temperature)的好处?

A. 提升生成答案的准确度

B. 增加模型的训练数据

C. 减少模型的推理时间

66. 自然语言处理(NLP)任务中,为什么需要对文本进行分词化?

A. 分词化是为了加强文本加密,保证数据传输的安全性

B. 分词化可以精简文本内容,删除不必要的信息,减少存储空间

C. 分词化目的是为了改善文本的阅读性,使人们阅读更加流畅

D. 分词化是将连续的字符序列切分成有意义的词汇单元,为后续的语法分析、语义理解等NLP任务提供基础

67. 在检索召回阶段,以下哪些方法提取标签用于后续标签过滤+向量相似度检索?

A. 提取标签

B. 问题改写

C. 重排序

68. 在大模型应用系统中,为了缓解有限长上下文问题,下列哪项措施不是通常采用的方法?

A. 实施对话历史的动态压缩技术

B. 引入注意力机制的改迸版本以提高长文本处理能力

C. 定期重初始化Agent以清除过时信息

69. 以下代码片段的作用是什么?os.environ ["OPENAI_API_KEY"]="your-api-key-here"

A. 从磁盘加载 API 密钥。

B. 将 API 密钥存储到内存中。

C. 将 API 密钥设置为环境变量。

70. 小王开发了一个AI音乐创作工具,在用户协议中声明对用户使用该工具创作的音乐作品享有所有权。这种做法是否合规?

A. 合规,开发者有权决定作品的版权归属

B. 不合规,用户拥有其创作作品的版权,开发者不能随意剥夺

C. 合规,只要在用户协议中明确声明即可

D. 不合规,建议咨询法律专业人士,制定更合理的版权归属方案

(二)多选题30 题 × 1 分 = 30 分

1. 你通过RAG为用户提供商品推荐服务。用户反馈说,在搜索“包子”时,推荐结果中经常出现”书包”的商品信息。后台分析发现,召回阶段确实会夹杂部分无关商品的信息。以下哪些措施能够有效提升该系统的推荐效果?

A. 降低检索阶段的相似度阈值 

B. 优化大模型的 prompt,强调要重点关注用户问题,避免输出无关商品信息

C. 在知识库中剔除书包相关的内容

D. 微调大模型,提高其在面对包含噪声数据的信息时筛选有效信息的能力

2. 在RAG应用的检索与生成阶段,主要优势包括哪些?

A. 提高大模型输出的准确性

B. 提高大模型输出的相关性

C. 减少模型推理时间

3. 在文档切片过程中,以下哪些切片方法适合处理长文档且需要保持上下文?

A. 句子窗口切片

B. 语义切片

C. Token 切片

4. 在提取标签的过程中,以下哪些标签类型是支持的?

A. 人名

B. 部门名称

C. 职位名称

D. 技术领域

E. 产品名称

5. 在检索召回阶段,以下哪些方法用于在检索后减少无关信息?

A. 重排序

B. 滑动窗口检索

C. 问题改写

6. 以下哪些情况可能导致大模型检索不准确?

A. 文档中包含大量的图片信息,而当前的文档解析器无法有效提取和理解图片内容。

B. 使用了基于深度学习的语义搜索引擎,但模型训练数据不足,导致检索结果不准确。

C. 文档中包含复杂的表格结构,而简单的文本解析器无法理解表格单元格之间的关系。

D. 使用了复杂的文档解析器,导致解析速度慢,影响检索效率。

E. 索引构建过程中使用了错误的 embedding 模型,导致语义相似度计算错误。

F. 文档切片时,仅简单地按照字符长度进行分割,丢失了文档的语义信息。

7. 在构建 RAG 应用时,大模型可以用于哪些其他应用场景?

A. 识别用户意图

B. 提取结构化信息

C. 提高模型训练速度

8. 在加载本地索引文件时,以下哪些参数可以设置?

A. 存储路径

B. 使用的embedding模型

C. API Key

9. Ragas 提供的以下哪些指标用于评估生成环节?

A. Answer Relevancy

B. Faithfulness

C. Context Precision

10. 在使用大模型提炼图文课程内容时,以下哪些指导原则是正确的?

A. 提炼关键信息,避免冗长段落

B. 使用简短标题,聚焦于要点

C. 内容应尽量详细和全面

D. 不做任何修改

11. 下列哪些因素会影响大语言模型微调的效果?

A. 是否采用数据增强技术

B. 计算资源的限制

C. 微调数据的质量和数量

D. 预训练模型的选择

E. 微调持续的轮数(epochs)

F. 微调时使用的超参数设置

12. 在问题改写中,以下哪些方法通过大模型生成更完整的问题?

A. 使用大模型扩充用户问题

B. 将单一查询改写为多步骤查询

C. 用假设文档来增强检索HyDE(Hypothetical Document Embeddings)

D. 重排序

13. 在 Ragas 中,以下哪些指标用于评估检索召回效果?

A. context precision

B. context recall

C. 增加模型的训练数据

14. 关于多模态技术底层原理,正确的说法是?

A. 图像理解模型也需要先将视频或图像分词化再做处理

B. 实现「方言语音合成」需要训练模型建立方言音素与标准发音的映射关系

C. 视频合成所花费的时间与可用的算力呈负相关

D. 文生图模型生成不同尺寸图像时,必须重新训练模型

15. 在构建 RAG 应用时,以下哪些是云服务向量存储的特点?

A. 无需关注运维

B. 自动扩容

C. 提供完善的监控和管理工具

D. 按量付费

16. GraphRAG 技术的优势包括哪些?

A. 准确回答具体问题

B. 处理需要深入理解的复杂查询

C. 提高模型训练速度

17. RAG 应用在检索时共召回了 10 条切片,其中 3 条高度相关,但 3 条内容都来自相邻段落,却被系统拆分成不同切片,从而导致回答时缺失连贯的上下文信息。哪些方案可进一步提升答案准确度?

A. 采用滑动窗口策略生成重叠的文本切片

B. 使用按照语义的切片策略,切分出语义更完整的切片

C. 提高 temperature 参数控制生成多样性

D. 调整切片大小使其覆盖完整更大段落范围

18. 你写了一个提示词“请用适合简报的形式,以每篇100字的篇幅总结今早的十大新闻”,你希望大模型能按照提示词完成任务,以下哪些方案可行?

A. 设计提示词,明确要求大模型要基于今天最新的新闻来总结,避免基于历史新闻总结

B. 设计提示词,结合 function call,让大模型回答时效性问题时,调用搜索工具

C. 整理历史新闻库,构建一个 RAG 应用,让大模型回答时参考知识库中的新闻

D. 使用阿里云百炼平台的 qwen-plus,并且调用 API 时设置 enable_search=True

19. 关于 Qwen-Max、CosyVoice 和 moviepy 的协同使用,以下哪些说法是正确的?

A. CosyVoice 可以将文本转换为音频。

B. CosyVoice 的主要功能是视频剪辑。

C. moviepy 可以直接将文本转换为视频。

D. Qwen-Max 主要用于生成视频字幕。

E. moviepy 可以用来获取音频文件的持续时间,用于生成字幕。

F. 使用这三个工具的典型流程是,Qwen-Max → CosyVoice → moviepy。

20. Assistant API 的 Assistant 类的各项功能中涵盖了以下哪些操作?

A. 删除

B. 更新

C. 剪切

D. 创建

E. 复制

F. 列举

21. 在切片向量化与存储阶段,以下哪些是余弦相似度的计算方法?

A. 计算向量之间的夹角

B. 计算向量的点积

C. 增加模型的训练数据

D. 减少模型的推理时间

22. 实现早停法(early stopping)策略时,考虑的条件可能包括:

A. 验证损失连续 n 轮不再下降

B. 验证损失达到预设阈值

C. 训练损失持续增加

D. 验证准确率连续提高

E. 训练准确率不再提高

F. 迭代次数达到预定最大值

23. 在切片向量化与存储阶段,以下哪些是 compare_embedding_models 函数的参数?

A. documents

B. question

C. ground_truth

24. APIAssistantAgent 示例代码 query 函数中,哪些步骤与大语言模型交互?

A. 调用 forward_and_submit_outputs 函数

B. 调用 dashscope.Runs.wait 函数

C. 创建 message 对象

D. 调用 dashscope.Messages.list 函数

E. 解析 msgs 获取最终答案

F. 调用 dashscope.Runs.create 函数

25. 在以下代码片段中,哪些参数可以影响生成文本的多样性?

A. temperature

B. max_tokens

C. presence_penalty

26. 在示例中,以下哪些是提示词中规定的输出要求?

A. 输出JSON格式

B. label只能取0或1

C. reason是错误的原因

27. 在 context precision 的计算过程中,以下哪些是判断 contexti 是否相关的依据?

A. question

B. ground_truth

C. 增加模型的训练数据

28. 在检索召回阶段,以下哪些方法通过增加更多信息让检索结果更全面?

A. 问题扩写

B. 基于用户画像扩展上下文

C. 问题改写

29. 关于 temperature 和 top_p 参数的作用,以下哪三个描述是正确的?

A. 较低的 top_p 可以提高生成内容的稳定性

B. 较低的 temperature 可以增加生成内容的多样性

C. 通常情况下,只需调整其中一个参数即可。

D. 较高的 temperature 可以增加生成内容的多样性

30. 如果将 RAG 与开卷考试相类比,下列哪两项描述最符合它们的相同之处?

A. 都是通过引入外部知识来增强输出

B. 人的思维与大模型的权重参数,都会随着外部知识的输入而发生改变

C. 都需要提前对知识作出标记,来帮助检索

D. 都不需要对问题本身进行理解即可回答

转载自CSDN-专业IT技术社区

原文链接:https://blog.csdn.net/xiaofeng10330111/article/details/159604629

评论

赞0

评论列表

微信小程序
QQ小程序

关于作者

点赞数:0
关注数:0
粉丝:0
文章:0
关注标签:0
加入于:--