腾云
最编程
2024-08-11 12:55:41
...
论文笔记:Comparing CNN and LSTM character-level embeddings in BiLSTM-CRF models for chemical and disease
主要工作主要目标是生物医学、化学和疾病命名实体识别,基于原来的CNN和LSTM模型加了字符向量。CNN训练速度更快,因为参数更少。数据集BioCreative VCDR corpus (Li et al., 2016).1000篇手工标注的摘要用于训练和验证,大概9193条句子500偏手工标注的摘要用于测试,大概4840条句子也用到了一个预处理过的此数据集版本,提供了POS-,ch...