品种本体构建¶
本体构建是一个长期且精细的工作,品种构建旨在收集整理出常见品种信息,包括名称、图片及描述等内容
常见品种的确定¶
可以根据counts对表格进行排序,取数值比较大的词条(比如n>1000或100,视总counts数而定,不要贪多,后期可以在补充)构建常见品种集。对于杂交品种建议以Hybrid统称即可。
| raw_string | counts | ontology |
|---|---|---|
| C57BL/6 | 975195 | C57BL/6 |
| C57BL/6J | 507208 | C57BL/6J |
| C57BL/6 | 406423 | C57BL/6 |
| CD-1 | 30932 | CD-1 |
| CD1 | 25345 | CD-1 |
| C57BL/6N | 24756 | C57BL/6N |
| BALB/c | 17040 | BALB/c |
| C57BL6 | 15504 | C57BL/6 |
| B6 | 14243 | C57BL/6 |
| not applicable | 13861 | TBD |
| not collected | 12124 | TBD |
| Wnt1-Cre | 11154 | WNT-1 Cre |
| C57BL6/J | 11130 | C57BL/6J |
对于品种的图片和描述信息可以选择性保存,也可以放在后续具体项目中完善
常见错误¶
a、将非品种描述定义为品种¶
如 wild type,等,除了TBD、unknown字段外,其他非品种描述都不能定位为品种
b、给模糊描述定义明确品种¶
如 Diversity Outbred 定义为J:DO,Outbred可能为很多个品种,这里绑定J:DO不恰当
c、地名为品种¶
比如Peking Duck不能定义为 Peking或者beijing
d、品种重复¶
比如Yorkshire和Large white是一个猪种,这选择一个即可
本文阅读量 次本站总访问量 次
Authors: