隨著深度學(xué)習(xí)的廣泛應(yīng)用,現(xiàn)代聊天機(jī)器人系統(tǒng)需要大規(guī)模的訓(xùn)練數(shù)據(jù)集才能達(dá)到其最佳性能,而手動(dòng)收集如此龐大的數(shù)據(jù)集需要耗費(fèi)巨大的人力和時(shí)間成本?,F(xiàn)欲開發(fā)一眾包信息系統(tǒng)來輔助收集訓(xùn)練數(shù)據(jù)集,其主要功能是:
(1)用戶管理。眾包工作者提供角色和標(biāo)識(shí),并存儲(chǔ)在用戶表中。
(2)添加問題。在不同情況下接收來自眾包工作者和管理員輸入的問題:眾包工作者輸入問題建議,管理員負(fù)責(zé)添加初始問題。將問題和問題類別分別進(jìn)行存儲(chǔ)。問題類別說明問題是由眾包工作者還是管理員提供的。
(3)答復(fù)問題。眾包工作者回答或拒絕系統(tǒng)隨機(jī)展示的5個(gè)問題。答復(fù)流程是,如果回答問題則提供答案,如果拒絕問題則提供拒絕原因,如果回答問題數(shù)不足5個(gè),繼續(xù)展示問題,否則眾包工作者提供問題建議。無論是回答還是拒絕,數(shù)據(jù)都存儲(chǔ)在帶有不同狀態(tài)標(biāo)記的答復(fù)表中。
(4)數(shù)據(jù)服務(wù)。根據(jù)其它訓(xùn)練平臺(tái)的請(qǐng)求,為其提供問題、問題類別、回復(fù)的數(shù)據(jù)集。
現(xiàn)采用結(jié)構(gòu)化方法對(duì)眾包信息系統(tǒng)進(jìn)行分析與設(shè)計(jì),獲得如圖1所示的上下文數(shù)據(jù)流圖和圖2所示的0層數(shù)據(jù)流圖。
圖1 - 上下文數(shù)據(jù)流圖
圖2 - 0層數(shù)據(jù)流圖
【問題1】(3分)
使用說明中的詞語,給出圖1中的實(shí)體E1~E3的名稱。
【問題2】(4分)
使用說明中的詞語,給出圖2中的數(shù)據(jù)存儲(chǔ)D1~D4的名稱
【問題3】(4分)
根據(jù)說明和圖中術(shù)語,補(bǔ)充圖2中缺失的數(shù)據(jù)流及其起點(diǎn)和終點(diǎn)。
【問題4】(4分)
什么是分層數(shù)據(jù)流圖中父圖與子圖的平衡?如何保持。