我院王永明课题组在Nature Communications上发表了题为“Optimized CRISPR guide RNA design for two high-fidelity Cas9 variants by deep learning”的文章。SpCas9是应用最广泛的CRISPR系统,但是它的特异性差,容易脱靶。为了克服此局限,科学家对它进行了改造,发明了多个特异性高的Cas9,其中包括SpCas9-HF1和eSpCas9(1.1)。但是由于缺少gRNA设计工具,这些改进的Cas9没有得到广泛应用。
针对这一问题,王永明课题组对人全基因组8万多个gRNA的效率进行了高通量的测量,在此基础上利用深度学习的方法建立了gRNA效率的预测模型,为它们的广泛应用奠定了基础。此外,研究人员还建立了针对SpCas9 gRNA设计的深度学习模型,与已有的模型相比,深度学习模型预测效果更好。这些模型可以在网站上免费使用(http://www.deephf.com)。
a. 实验设计。针对人基因组每个基因设计4个gRNA,用芯片合成gRNA极其靶序列,连接到慢病毒载体上,转染到表达Cas9的细胞中进行编辑。靶序列用PCR将扩增出来深度测序;b. 预测模型示意图。深度学习与4个生物学特征结合起来预测效果最好。
王大奇博士和张成东博士是论文的共同第一作者,复旦大学的王永明教授和北京安贞医院的兰峰教授是该论文的共同通讯作者。
全文链接:https://www.nature.com/articles/s41467-019-12281-8