跳转至

品种本体构建

本体构建是一个长期且精细的工作,品种构建旨在收集整理出常见品种信息,包括名称、图片及描述等内容

常见品种的确定

可以根据counts对表格进行排序,取数值比较大的词条(比如n>1000或100,视总counts数而定,不要贪多,后期可以在补充)构建常见品种集。对于杂交品种建议以Hybrid统称即可。

raw_string counts ontology
C57BL/6 975195 C57BL/6
C57BL/6J 507208 C57BL/6J
C57BL/6 406423 C57BL/6
CD-1 30932 CD-1
CD1 25345 CD-1
C57BL/6N 24756 C57BL/6N
BALB/c 17040 BALB/c
C57BL6 15504 C57BL/6
B6 14243 C57BL/6
not applicable 13861 TBD
not collected 12124 TBD
Wnt1-Cre 11154 WNT-1 Cre
C57BL6/J 11130 C57BL/6J

对于品种的图片和描述信息可以选择性保存,也可以放在后续具体项目中完善

常见错误

a、将非品种描述定义为品种

如 wild type,等,除了TBD、unknown字段外,其他非品种描述都不能定位为品种

b、给模糊描述定义明确品种

如 Diversity Outbred 定义为J:DO,Outbred可能为很多个品种,这里绑定J:DO不恰当

c、地名为品种

比如Peking Duck不能定义为 Peking或者beijing

d、品种重复

比如Yorkshire和Large white是一个猪种,这选择一个即可

本文阅读量  次
本站总访问量  次
Authors: Wind