现代人类学教育部重点实验室王永明课题组在Nature Communications上发表了题为“Optimized CRISPR guide RNA design for two high-fidelity Cas9 variants by deep learning”的文章。SpCas9是应用最广泛的CRISPR系统,但是它的特异性差,容易脱靶。为了克服此局限,科学家对它进行了改造,发明了多个特异性高的Cas9,其中包括SpCas9-HF1和eSpCas9。但是由于缺少gRNA设计工具,这些改进的Cas9没有得到广泛应用。
针对这一问题,王永明课题组对人全基因组8万多个gRNA的效率进行了高通量的测量,在此基础上利用深度学习的方法建立了gRNA效率的预测模型,为它们的广泛应用奠定了基础。此外,研究人员还建立了针对SpCas9 gRNA设计的深度学习模型,与已有的模型相比,深度学习模型预测效果更好。这些模型可以在网站上免费使用(http://www.deephf.com)。
a. 实验设计。针对人基因组每个基因设计4个gRNA,用芯片合成gRNA极其靶序列,连接到慢病毒载体上,转染到表达Cas9的细胞中进行编辑。靶序列用PCR将扩增出来深度测序;b. 预测模型示意图。深度学习与4个生物学特征结合起来预测效果最好。
王大奇博士和张成东博士是论文的共同第一作者,王永明教授和北京安贞医院的兰峰教授是该论文的共同通讯作者。
全文链接:https://www.nature.com/articles/s41467-019-12281-8