张京芬,女,研究员,美国密苏里大学计算机系数字化生物实验室。1993年7月,华中师范大学理论数学专业学士。1998年获得计算机科学专业硕士,导师为黄文奇,论文题目为《求解等圆和不等圆packing问题的快速近似算法》。2006年7月获得中国科学院计算技术研究所计算机科学专业博士,导师为高文,博士论文为《串联质谱数据预处理》。
工作经历
2006年12月至今,美国密苏里大学计算机系数字化生物实验室,研究员
- 设计并开发了蛋白质结构预测系统MUFOLD, 主要贡献在于设计并实现了基于图模型的结构预测方法以及结构预测系统中多个层面的质量评估方法。MUFOLD极大地提高了结构预测的计算速度,能在几小时甚至几分钟内完成从序列到结构的预测。
- 提出新的衡量蛋白质结构距离的方法Dscore1和Dscore2,分别刻画蛋白质结构间的差异及相似程度。在Dscore基础上开发了大规模蛋白质结构模型数据的快速聚类及图示方法MUFOLD-CL。相比于其它二次的时间和空间复杂度的聚类方法,MUFOLD-CL达到线性的时间和空间计算复杂度,但同时保持了同等甚至更好的聚类及最优模型选择功效。
- 参加CASP (Critical Assessment of Techniques for Protein Structure Prediction: http://predictioncenter.org/index.cgi)系列比赛。主要开发了MUFOLD-Server,并与人合作开发了MUFOLD-MD,MUFOLD-QA以及MUFOLD-WQA,这些系统分别参与了CASP8(2008年), CASP9(2010年)以及CASP10(2012年) 的比赛,并获得相应的成绩。根据CASP组委会的评估,
- 在CASP8中, MUFOLD-MD 在自由建模(free modeling FM)类别的server prediction中列为第一名。
- 在CASP9中, MUFOLD-MD和MUFOLD-Server在FM类别的sever prediction中分别为第七名和第九名,MUFOLD-Server在基于模板建模(template-based TMB)类别的server prediction中列为第10名。
- 在CASP9中,MUFOLD在human prediction类别中列为第一名。MUFOLD采用和MUFOLD-Server相同的流程,但使用了CASP提供的预测的结构模型信息。
- 在CASP9中,MUFOLD-WQA和MUFOLD-QA在对预测的结构模型的质量评估类别的比赛中分别列为第一名和第二名。
- 与UIUC(伊利诺斯大学伊利诺伊大学香槟分校)的研究人员合作,整合MUFOLD 和 MDFF (http://www.ks.uiuc.edu/Research/mdff/)系统,结合从蛋白质序列出发预测的结构信息以及试验获取的低分辨率的低温电子显微图像数据来研究蛋白质的结构和功能。
2001年9月-2006年6月,中科院计算技术研究所,联合实验室,研究助理
- 2003年-2006年蛋白质鉴定
- 设计算法对串联质谱数据进行预处理,包括有效谱峰识别,谱峰荷质比误差估计及校正等。这些算法集成到pFind 系统(http://pfind.ict.ac.cn/)。
- 设计算法分析质谱数据中的同位素谱峰信息,并通过这些信息预测谱峰对应离子的元素组成成分。
- 2002年-2003年参与蛋白质-蛋白质相互作用网络的研究
- 协助分析酵母的蛋白质-蛋白质相互作用网络的拓扑结构。
- 协助分析SARS-CoV病毒的起源以及进化树。
- 2001年-2003年DNA序列拼接
- 提出基于最短公共母串以及局部搜索方法的DNA序列片断拼接算法,并开发了DNA 序列片断拼接系统LSA。
- 参与中科院北京基因研究所(BGI, CAS)水稻基因测序课题,协助拼接以及分析水稻基因序列。
1998年7月-2001年9月,广州金鹏集团公司,研发中心,软件工程师
- 负责设计及开发EIM-601程控交换设备以及JPM-I移动通信系统设备的时钟同步系统。
1995年9月-1998年7月华中科技大学,计算机系,研究助理
- 设计并实现求解等圆不等圆packing问题的快速近似算法。
- 设计并实现求解析取范式可满足性问题(CNF-SAT)的近似算法。
开发软件
- MUFOLD_CL: 蛋白质结构模型聚类工具
http://mufold.org/clustering.php - MUFOLD web-server:提供在线的从蛋白质序列开始的结构预测服务
http://mufold.org/prediction.php - pdbLight:提供按用户需求制定的蛋白质序列到结构的数据下载服务
http://mufold.org/pdblight.php
研究资助基金
NIH R01 GM100701-01, Development of MUFOLD for Building High-Accuracy Protein Structure Models。(项目共同负责人)已发表文章:
期刊文章
- N. Ahsan, K.N. Swatek, J. Zhang, J.A. Miernyk, D. Xu, J.J. Thelen, "Scanning mutagenesis" of the amino acid sequences flanking phosphorylation site 1 of the mitochondrial pyruvate dehydrogenase complex, Front Plant Sci., 2012; 3:153.
- Z. Yuan, C. Liu, H. Wang, R. Sun, Y. Fu, J. Zhang, L. Wang, H. Chi, Y. Li, L. Xiu, W. Wang and S. He, "pParse: a method for accurate determination of monoisotopic peaks in high-resolution mass spectra", Proteomics. 2012;12(2):226-35.
- Z. He, J. Zhang, Y. Xu, Y. Shang and D. Xu, "Protein structural model selection based on protein-dependent scoring function", Statistics and Its Interface, 2012;5: 109-115.
- Zhang J, Wang Q, Vantasin K, Zhang J, He Z, Kosztin I, Shang Y, Xu D. "A multi-layer evaluation approach for protein structure prediction and model quality assessment", Proteins: Struct Funct Bioinformatics, 2011;79(10):172-84.
- X. Shi, J. Zhang*, Z. He, Y. Shang, and D. Xu, "A sampling-based method for ranking protein structural models by integrating multiple scores and features", Current Protein and Peptide Science, 2011; 12(6):540-8. *denotes co-first authors.
- J. Zhang, Q.G. Wang, B. Barz, Z.Q. He, I. Kosztin, Y. Shang, and D. Xu, "MUFOLD: A New Solution for Protein 3D Structure Prediction", Proteins: Struct Funct Bioinformatics, 2009; 78(5), 1137-52.
- J. Zhang, D. Xu, W. Gao, G. Lin, S. He, "Isotope Pattern Vector Based MS/MS Data Calibration for Improved Peptide and Protein Identification", Rapid Commun Mass Spectrom., 2009; 23, 3448–3456.
- J. Zhang*, S.M. He, C.X. Ling, X .J. Cao, R. Zeng, and W. Gao, "PeakSelect: preprocessing tandem mass spectra for better peptide identification", Rapid Commun Mass Spectrom., 2008; 22(8), 1203-1212. *denotes co-corresponding authors.
- S. Sun, C. Yu, Y. Qiao, Y. Lin, G. Dong, C. Liu, J. Zhang, Z. Zhang, J. Cai, H. Zhang and D. Bu, "Deriving the probabilities of water loss and ammonia loss for amino acids from tandem mass spectra", J. Proteome Res., 2008; 7 (01), 202–208.
- L. Wang, D. Li, Y. Fu, H. Wang, J. Zhang, Z. Yuan, R. Sun, R. Zeng, S. He, and W. Gao, "pFind 2.0: a software package for peptide and protein identification via tandem mass spectrometry". Rapid Communications in Mass Spectrometry, 2007; 21, 2985-2991.
- C. Yu, Y. Lin, S. Sun, J. Cai, J. Zhang, Z. Zhang, R. Chen, and D. Bu, "An iterative algorithm to quantify the factors influencing peptide fragmentation for ms/ms spectrum", J Bioinform Comput Biol., 2007; 5 (2),297-311.
- R. Sun, Y. Fu, D. Li, J. Zhang, X. Wang, Q. Sheng, R.Zeng, Y. Chen, S. He, and W. Gao, "Computational Proteomics Based on Spectrometry Technology", Science in China Ser. E Information Sciences, 2006; 36, 222-234.
- J. Yu, J. Wang, W. Lin, …, J. Zhang, …, H. Yang, "The Genomes of Oryza sativa: A History of Duplications", PLoS Biol. 2005; 3(2), e38, 0266-0281. *denotes the 56th of 117 authors.
- J. Zhang, W. Gao, J.J. Cai, S.M. He, R. Zeng, and R.S. Chen, "Predicting Molecular Formulas of Fragment Ions with Isotope Patterns in Tandem Mass Spectra", IEEE/ACM Transactions on Computational Biology and Bioinformatics, 2005; 2(3), 217-230.
- J. Zhang, S.M. He, J.J. Cai, X.J. Cao, R.X. Sun, Y. Fu, R. Zeng and W. Gao, "Preprocessing of tandem mass spectrometric data based on decision tree classification", Genomics, Proteomics & Bioinformatics, 2005; 3(4), 231-237. *denotes corresponding author.
- H.C. Lu, Y. Zhao, J. Zhang, Y.L. Wang, W. Li, X.P. Zhu, S. W. Sun, J.Y. Xu, L.J. Ling, L. Cai, D.B Bu, and R.S. Chen, "Date of origin of the SARS coronavirus strains", BMC Infectious Diseases, 2004;4:3.
- H.C. Lu, X.P. Zhu, H.F. Li, G. Skogerbo, J. Zhang, Y. Zhang, L. Cai, Y. Zhao, S.W. Sun, J.Y. Xu, D.B. Bu, and R.S. Chen. "The interactome as a tree-an attempt to visualize the protein–protein interaction network in yeast", Nucleic Acids Res. 2004; 32(16), 4804-4811.
- Z. Qi, Y. Hu, W. Li, Y.J. Chen, Z.H. Zhang, S.W. Sun, H.C. Lu, J. Zhang, D.B. Bu, L.J. Ling & R.S. Chen, "Phylogeny of SARS-CoV as inferred from complete genome comparison", Chinese Science Bulletin, 2003;48(12),1175-1178.
- D. Bu, Y. Zhao, L. Cai, H. Xue, X. Zhu, H. Lu, J. Zhang, S. Sun, L. Ling, N. Zhang, G. Li and R. Chen, "Topological structure analysis of the protein-protein interaction network in budding yeast", Nucleic Acids Research, 2003; 31(9), 2443-2450.
- W. Huang, R. Xu, W. Chen, and J. Zhang, "Physicalification and personification for solving unequal circle packing and CNF-SAT problems", Journal of Huazhong University of Science and Technology, 1998; 26(9), 5-7.
- J. Zhang, "The Moore-Penrose inverse about product and sum of morphism", Journal of Central China Normal University, 1993; 27(3), 294-297. *denotes corresponding author.
会议文章
- J. Zhang and D. Xu, "Fast Algorithm for Clustering a Large Number of Protein Structural Decoys", Proceedings of the 2011 IEEE International Conference on Bioinformatics and Biomedicine (BIBM '11), 2011: 30-36.
- C.G. Yu, Y. Lin, S.W. Sun, J.J. Cai, J. Zhang, Z. Zhang, R.S. Chen, D.B. Bu, "An iterative algorithm to quantify the factors influencing peptide fragmentation for ms/ms spectrum", Computational systems bioinformatics, Stanford, USA, 2006:353-60.
- J. Zhang, D.B. Bu, J.Y. Xu, S.M. He, W. Gao, and M. Li, "LSA: More Accurate DNA Fragment Assembly", Proceedings of the RECOMB 2003 satellite meeting on DNA Sequencing Technologies and Computation, Stanford, USA, May, 2003.
- J. Zhang, W. Gao, J. J. Cai, S.M. He, R. Zeng, and R.S. Chen, "Predicting Molecular Formulas of Fragment Ions with Isotope Patterns in Tandem Mass Spectra", Human Proteome Organisation 3rd Annual World Congress, Beijing, China, Oct., 2004.
- J. Zhang, S.M. He, J.J. Cai, X.J. Cao, R.X. Sun, Y. Fu, R. Zeng and W. Gao, "Preprocessing of tandem mass spectrometric data based on decision tree classification", China National Computer Conference, Wuhan, China, Oct., 2005.
参与撰写的图书
- Y. Shang, Q. Wang, J. Zhang, B. Barz, R.Bondugula, I. Kosztin and D. Xu, "A New Computational Intelligent Approach to Protein Tertiary Structure Prediction", Advance in Computational Intelligence. Ed: Xin Yao. University of Science and Technology of China Press, 2008.
- J. Zhang, Z. He, Q. Wang, B. Barz, I. Kosztin, Y. Shang and D. Xu, " Prediction of protein tertiary structures using MUFOLD", Functional Genomics, second edition. Ed: M. Kaufmann and C. Klinger. Humana Press, 2012.
发明专利
- 高文,张京芬,贺思敏:ZL 200610164852.X:一种质谱质量测量误差的预测方法
http://www.aptchina.com/faming/2577340/ - 高文,张京芬,贺思敏:ZL 200610072168.9 :一种基于质谱数据同位素模式的质谱有效峰选取方法
http://www.aptchina.com/faming/2837336/ - 高文,张京芬,贺思敏:ZL 200610072169.3:一种质谱数据处理中噪音基线识别方法
http://www.aptchina.com/faming/2918776/ - 高文,张京芬,蔡津津,贺思敏,曾嵘,陈润生,王海鹏:ZL 200410090806.0:一种用串联质谱中碎片离子同位素峰预测离子分子式方法
http://www.aptchina.com/faming/2853269/
软件著作权
- 张京芬,袁作飞:质谱数据处理 - 预测离子分子式, 软件注册号:2008SR06237.
- 张京芬,袁作飞:质谱数据处理 - 有效谱峰选取, 软件注册号:2008SR06252.
- 张京芬,袁作飞:质谱数据处理 - 质谱数据校准, 软件注册号: 2008SR06255.
联系方式:
E-mail:zhangjingf@missouri.edu
电话:73-882-5994 (Office) and 573-746-0849 (Mobile)
地址:1722 E Broadway Apt D, Columbia, MO 65201