欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

腾云

最编程 2024-08-11 12:55:41
...

论文笔记:Comparing CNN and LSTM character-level embeddings in BiLSTM-CRF models for chemical and disease

主要工作主要目标是生物医学、化学和疾病命名实体识别,基于原来的CNN和LSTM模型加了字符向量。CNN训练速度更快,因为参数更少。数据集BioCreative VCDR corpus (Li et al., 2016).1000篇手工标注的摘要用于训练和验证,大概9193条句子500偏手工标注的摘要用于测试,大概4840条句子也用到了一个预处理过的此数据集版本,提供了POS-,ch...