Add course homework answer (#583)

smallv0221 · web-flow · commit 995ebc158972 · 2021-06-17T17:29:46.000+08:00
* Fix dataset doc

* fix dataset doc

* Change load_dataset design for loading local dataset

* Update softmax_with_cross_entropy to cross_entropy

* Fix community provided datasets and fix cross_entropy for elmo and dgu

* Add course homework answer
diff --git a/education/day06.md b/education/day06.md
@@ -0,0 +1,56 @@
+# Day06 检索问答作业辅导
+
+本教程旨在辅导同学如何完成 AI Studio课程课后作业——[必修 | 检索式文本问答
+](https://aistudio.baidu.com/aistudio/education/objective/25708)。
+
+## 1. 检索式问答系统一般包括哪两部分？
+
+    A. 问题解析+答案抽取
+    B. 段落检索+阅读理解
+    C. 段落检索+答案排序
+
+    正确答案：B
+
+    解析：检索式问答系统一般包括两个步骤：1）段落检索，从大规模候选库中检索出相关文档/段落，2）阅读理解，从候选文档/段落中获取精确答案
+
+## 2. 抽取式阅读理解任务的训练目标是什么？
+
+    A. 答案的开始位置和结束位置
+    B. 答案的开始位置和答案长度
+    C. 答案的内容
+
+    正确答案：A
+
+    解析：抽取式阅读理解任务的训练目标可转换为预测答案的开始位置和结束位置
+
+## 3. 阅读理解模型目前还存在哪些问题？
+
+    A. 鲁棒性问题
+    B. 泛化性问题
+    C. 过稳定和过敏感问题
+    D. 以上都是
+
+    正确答案：D
+
+    解析：阅读理解模型目前还存在泛化性差、鲁棒性差（过稳定和过敏感）等问题
+
+## 4. 下列关于稠密向量检索和稀疏向量检索，说法错误的是？
+
+    A. 稀疏向量检索只能捕捉字面匹配信息，稠密向量检索可以捕捉语义匹配信息
+    B. 稠密向量检索一般基于对偶模型结构来训练
+    C. 稠密向量检索是不可学习的
+
+    正确答案：C
+
+    解析：稠密向量检索是可学习的，一般基于对偶模型结构来训练
+
+## 5. 下列哪项不是in-batch负采样训练对偶模型的好处？
+
+    A. 可以重复利用已经计算好的向量表示
+    B. 可以增加强负例的数量
+    C. 可以在几乎不增加计算量的同时，增加训练时见到负例的数量
+    D. 可以扩展为跨批次(cross-batch)负采样
+
+    正确答案：B
+
+    解析：in-batch负采样可以增加训练时见到的弱负例的数量
diff --git a/education/day07.md b/education/day07.md
@@ -0,0 +1,58 @@
+# Day07 结构化数据问答作业辅导
+
+本教程旨在辅导同学如何完成 AI Studio课程课后作业——[必修 | 结构化数据问答
+](https://aistudio.baidu.com/aistudio/education/objective/25709)。
+
+## 1. 相比于无结构化文本的问答，结构化问答的优势在于？
+
+    A. 匹配能力
+    B. 推理能力
+    C. 数据易于存储
+
+    正确答案：B
+
+    解析：略
+
+## 2. 结构化问答的输入形式为
+
+    A. 文档+问题
+    B. 问题-答案对
+    C. 知识库+问题
+    D. 问题
+
+    正确答案：C
+
+    解析：略
+
+## 3. 以下哪个不是Text-to-SQL任务的基本要素
+
+    A. 数据库
+    B. SQL语句
+    C. 答案
+    D. 自然语言问题
+
+    正确答案：C
+
+    解析：略
+
+## 4. 以下哪个数据集不是cross-domain数据集
+
+    A. ATIS
+    B. WikiSQL
+    C. DuSQL
+    D. CSpider
+
+    正确答案：A
+
+    解析：略
+
+## 5. 基于语法的解码，主要是从哪个维度考虑的
+
+    A. 解码速度快
+    B. 输出结果语法合理
+    C. 易于扩展
+    D. 输出结果可执行
+
+    正确答案：B
+
+    解析：略
diff --git a/education/day08.md b/education/day08.md
@@ -0,0 +1,60 @@
+# Day08 机器翻译作业辅导
+
+本教程旨在辅导同学如何完成 AI Studio课程课后作业——[必修 | 文本翻译技术及应用
+](https://aistudio.baidu.com/aistudio/education/objective/25710)。
+
+## 1. 机器翻译任务与以下哪个NLP任务最相似？
+
+    A. 文本匹配
+    B. 情感分析
+    C. 实体识别
+    D. 生成式对话
+
+    正确答案：D
+
+    解析：机器翻译模型是序列到序列的生成任务，输入原文句子，输出译文句子。
+
+        A：文本匹配是语义相似度任务。输入两个句子，输出相似度得分。
+        B：情感分析一般建模成分类任务，输入一个句子序列，输出是类别标签
+        C：实体识别一般建模成序列标注任务，输入是序列，输出是序列的标签，标签的个数一般与输入的序列相同。
+        D：生成式对话是生成任务，输入前文句子，输出一个句子作为回应
+
+## 2. 用BLEU评价足以反映机器翻译模型的优劣。
+
+    A. 是
+    B. 否
+
+    正确答案：B
+
+    解析：BLEU计算候选译文和参考答案的ngram准确度，并不能充分提现语义信息
+
+## 3. 统计机器翻译模型一般由哪两个部分组成？
+
+    A. 编码器+解码器
+    B. 语料库+检索算法
+    C. 翻译模型+语言模型
+    D. 词典+规则
+
+    正确答案：C
+
+    解析：统计机器翻译由翻译模型和语言模型组成，翻译模型用来计算原文和译文的翻译概率；语言模型用来提现译文的流畅度
+
+## 4. 神经网络机器翻译模型一般由哪两个部分组成？
+
+    A. 编码器+解码器
+    B. 语料库+检索算法
+    C. 翻译模型+语言模型
+    D. 词典+规则
+
+    正确答案：A
+
+    解析：神经网络机器翻译模型通常由编码器+解码器组成，也是大部分生成式任务的神经网络结构
+
+## 5. 对于句子分类任务，我们可以把输入的句子作为源语言句子，“类别”作为目标语言句子，这样就可以当成神经网络翻译任务来解。
+
+    A. 是
+    B. 否
+
+    正确答案：A
+
+    解析：神经网络翻译是一个文本到文本的生成任务，其它任务只要可以建模成文本-文本这种结构，都可以在生成任务的框架下解决
diff --git a/education/day10.md b/education/day10.md
@@ -0,0 +1,56 @@
+# Day10 任务型对话作业辅导
+
+本教程旨在辅导同学如何完成 AI Studio课程课后作业——[必修 | 任务式对话系统
+](https://aistudio.baidu.com/aistudio/education/objective/25711)。
+
+## 1. 用于订票的机器人主要使用以下哪种对话技术？
+
+    A. 开放域对话
+    B. 任务式对话
+    C. 问答型对话
+
+    正确答案：B
+
+    解析：订票属于完成特定任务，主要使用任务式对话
+
+## 2. 以下哪个不是Pipeline型任务式对话中的主要任务？
+
+    A. NLU
+    B. DST
+    C. NLG
+    D. ASR
+
+    正确答案：D
+
+    解析：Pipeline型任务式对话包含NLU、DST、Policy、NLG四个部分。ASR语音识别不在其中。
+
+## 3. 以下哪个不是典型NLU任务的主要识别目标
+
+    A. 意图
+    B. 词槽
+    C. 动作
+
+    正确答案：C
+
+    解析：典型NLU任务一般识别用户输入的意图和词槽。
+
+## 4. 以下哪个数据集不可以用来进行DST任务？
+
+    A. ATIS
+    B. MultiWOZ
+    C. CrossWOZ
+
+    正确答案：A
+
+    解析：ATIS是一个NLU的数据集，MultiWOZ和CrossWOZ是DST的数据集。
+
+## 5. 关于任务型对话系统，以下表述正确的是？
+
+    A. Pipeline型任务式对话系统的可解释性较弱。
+    B. 相对Pipeline型系统，纯端到端型任务式对话系统不存在错误的累积和传播
+    C. 商业系统中，一般使用的是端到端型任务式对话系统。
+    D. 端到端型任务式对话系统采用的都是Seq2Seq框架。
+
+    正确答案：B
+
+    解析：相对Pipeline型系统，由于纯端到端型系统是整体联合优化，避免了Pipeline型系统中每个模块产生错误的的累积和传播。
diff --git a/education/day11.md b/education/day11.md
@@ -0,0 +1,49 @@
+# Day11 开放域对话作业辅导
+
+本教程旨在辅导同学如何完成 AI Studio课程课后作业——[必修 | 开放域对话系统
+](https://aistudio.baidu.com/aistudio/education/objective/25753)。
+
+## 1. 对于多轮闲聊对话，以下哪种技术路线可以产生更连贯的回复？
+
+    A. 检索式系统
+    B. 生成式系统
+
+    正确答案：B
+
+    解析：检索式系统，是从大规模语料库中检索出一些比较相关的回复，但较难保持多轮对话的连贯自然
+
+## 2. 对话生成模型常用的训练目标，是最小化以下哪种 loss ？
+
+    A. Negative Log-likelihood (NLL) loss
+    B. Bag-of-words (BOW) loss
+
+    正确答案：A
+
+    解析：一般是最小化 NLL loss
+
+## 3. 如果想要模型生成更多样化的回复，应该采用以下哪种解码策略？
+
+    A. Greedy decoding
+    B. Sampling-based decoding
+
+    正确答案：B
+
+    解析：Sampling-based decoding 可以得到更多样化/随机的回复
+
+## 4. 使用 top-p sampling 进行生成，如果减少 p 的取值，会产生怎样效果的回复？
+
+    A. 更通用/安全的回复
+    B. 更多样化/有风险的回复
+
+    正确答案：A
+
+    解析：减小 p 产生更通用/安全的结果
+
+## 5. 以下哪个自动评估指标，常用来衡量生成的多样性？
+
+    A. Distinct-1/2
+    B. BLEU
+
+    正确答案：A
+
+    解析：Distinct-1/2 衡量生成的多样性