- 961.01 KB
- 2022-08-12 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
ByJasonWan结构生物学概论目录哈第一章结构生物学的研究现状与发展趋势结构生物学诞生的背景;结构生物学时代的到来;结构生物学是生命科学的前沿和主流;结构生物学主要研究手段简介;结构基因组学简介;结构生物学研究的新进展。第二章结构生物学的研究方法核磁共振;电子晶体学和电子显微学三维重构;X射线晶体学第三章蛋白质分离纯化及其晶体生长1.蛋白质的表达与纯化[主要内容]:蛋白质在大肠杆菌、昆虫细胞和酵母中表达的原理、方法和关键技术;蛋白质的纯化方法和纯度鉴定。2.蛋白质的结晶和晶体生长[主要内容]:蛋白质结晶的原理、技术和方法、对材料的要求、晶体生长的理化条件、晶体的鉴定。第四章蛋白质晶体结构的解析3.衍射数据的收集[主要内容]:晶体的收集与冷冻处理;X射线源的选择;衍射线记录装置及其使用方法;衍射数据收集的全自动化。4.蛋白质结晶结构的解析[主要内容]:蛋白质晶体空间群(Spacegroup);相位(Phase)的测定;电子密度图的解释;结构模型的修正与精化。Acknowledge:感谢斑马王子搞定PROJECT,拯救小万于水火之中,特此感谢~2010/6/16JasonWan无语无奈无结构1\nByJasonWan第一章结构生物学的研究现状与发展趋势内涵:结构生物学:以生物大分子三维结构测定为手段、以生物大分子结构与功能研究为内容、以探讨和阐明生物学各前沿领域中分子作用机制和原理为目的;是当前分子生物学的基础和前沿领域,它更是生物物理学的核心。生物大分子发挥其生物学功能必需具备:(1)稳定的、特征的三维结构(2)其三维结构在各个水平上的运动•结构生物学是以生物大分子三维结构及其运动的研究结果为基础,定量地阐明生命现象的科学。•生物大分子的结构是研究生物反应机理和路径的重要基础•生物分子结构与功能关系的研究一直是分子生物学的核心。•三维结构与功能关系研究的迅速发展已成为现代分子生物学的前沿与主流。•结构生物学是一个多学科交叉的前沿,其中包括生物、物理、化学和计算数学等。•几乎每一个重要生物大分子及其复合物高分辨率三维结构的测定,都从分子水平上阐明了一个基本生命现象。生命科学中的每一分枝学科无一不在充分地运用结构生物学研究的最近成就。•分子生物学中的每一个重要问题都是在三维结构的基础上给予阐明的;过去、现在和将来,分子生物学中每一个重大的突破都是并必将是与其三维结构研究的突破密切相关,对药物开发和研究有直接和非常重大的意义。研究手段:1.X射线单晶衍射⎯⎯蛋白质晶体学2.核磁共振谱学(NMR)3.电子晶体学及电镜三维重组4.其他各种谱学方法,如CD谱,质谱无论从已测定生物大分子三维结构的数量上、精确度上及其发展潜力上,X射线单晶衍射方法⎯蛋白质晶体学⎯至今及可见的将来仍将占统治地位,发展历程略:见1的17页各种奖到时候过的时候写一边就好,蓝体字的哈。X射线—铅屏—晶体—底片,出现劳厄斑点:晶体可以看做三维立体光栅,根据劳厄斑点分布可算出晶面间距,掌握晶体结构。三维重构:是电子显微图像含有振幅和相位的信息,二者可通过数字图像处理的傅立叶变换方法提取出来.三大方法:X射线衍射技术,核磁共振,电镜三维重建技术。特别是多分子的复合体和膜蛋白结构的突破结构基因组计划在全球兴起雷啊……发展趋势:特点1:1以蛋白质晶体学为主要手段,加以NMR方法的不断突破,生物大分子三维结构测定在高速发展.2结构生物学的研究成果已渗透到生命科学的各个领域.3国际上很多难度高、意义重大的三维结构均是在近十来年突破的4结构研究已由单一分子进入分子间相互作用的复合物以及由许多分子所构成的复合体,乃至分子机器.5结构研究的兴趣由水溶性球蛋白进入攻克疏水的膜蛋白结构PDB:(ProteinDataBank)最近多,快。组成:title标题,author作者,citation引用。特点2:•静态结构到动态变化.•技术和方法在高速发展.•基础研究不断深入与扩展的同时,应用研究在迅速发展.•竞争日趋激烈.•结构生物学的迅猛发展在后基因组时代必然导致结构基因组学的崛起.核磁共振(NMR)谱学方面:1目前高质量的NMR结构已经达到相当于2-2.5Å分辨率的晶体结构.2.900MHz的NMR谱仪已大量涌入实验室.3高磁场条件下,使用TROSY方法有可能将NMR测定的蛋白质的分子量增加.4稀液晶使蛋白质取向受到约束,偶极—偶极耦合信息为结构解析提供更多约束,加上氢键的测定,可进一定提高结构测定精度.5自动化的波谱解析方法有望大大提高结构测定速度.结构基因组学的兴起:结构基因组计划(StructuralGenomicProject)(蛋白质提纯---机器人筛选晶体)•大量蛋白质三维结构的确定•蛋白质按基因序列的分族•每族中有代表性的蛋白的三维结构的测定•检验“基因序列决定蛋白结构”的观念,预言新的结构•蛋白—蛋白相互作用•深入理解功能—结构的关系,有关键功能的结构与无关大要的结构•将所得知识用于药物开发、疾病治疗、医疗诊断、基因工程中国发展:略可以看看红体字哈。无语无奈无结构2\nByJasonWan第二章结构生物学的研究方法(薛定谔)一.结构生物学的重要性•结构生物学在“后基因组时代”生物学中的地位:在蛋白质一级结构(序列信息)基本上都知道后,为全面深入理解生命奥秘就要求了解蛋白质的结构信息。因此,结构基因组学应运而生。•蛋白结构以及大分子相互作用是揭示生物功能及研究人类疾病分子机理的基本前提。•大分子结构也是合理药物设计和蛋白质工程等应用研究的重要基础。创新药物的研究的基础?基于蛋白质三维结构的合理药物设计与组合化学以及高通量筛选结合引起了医药工业新的革命。?这是围绕新药物研究开发基础性,前瞻性,战略性研究。?生命科学的技术前沿和新的制高点。无用的奇怪小结:1结构生物学的产生与发展使生命科学的体系和结构发生深刻变化。2生物与化学、物理学的界限在模糊,在理论上趋于统一。对象:宏观现象⇒微观本质3大量蛋白质结构的解析与分析,使人们对“结构—功能”的认方法学:描述、归纳⇒演绎、推理识更加深入。理论层次:定性⇒定量结构生物学研究的主要技术手段:1.显微方法(衍射或散射)•X射线晶体学(X-raycrystallography)PS:高通量:大量样品的快速筛选优点:方法很成熟,可高通量化,分辨率高,可快速测定结构;缺点:需要可衍射单晶,有相位问题。•电子显微学(electronmicroscopy,EM),CryoEM优点:不需大单晶,无相位问题,可观察原位及单粒子结构;缺点:分辨率低,仪器昂贵,操作复杂;与高分辨X光结构结合,前景可观。•小角散射方法:X射线(SAXS),可见光。2.波谱方法•核磁共振(NMR)优点:溶液构象,无需结晶,无相位问题,可得到动力学信息;缺点:方法尚在发展中,仍限于较小分子量蛋白质结构测定。•其他谱学方法:例如各种光谱学方法(可见;紫外;荧光;红外;园二色;RAMAN等等);EPR;EXAFS3.质谱方法等13161.NMR光谱学:样品C/N标记的—入磁场—连续脉冲—获得1D,2D,3D光谱—计算机—3D结构*核磁共振(NuclearMagneticResonance,简写为NMR),是指核磁矩不为零的核,在外磁场的作用下,核自旋能级发生塞曼分裂(ZeemanSplitting),共振吸收某一特定频率的射频(radiofrequency简写为rf或RF)辐射的物理过程。在磁场下,这些自旋偶极子会排列成行,并产生两个相反的自转方向P43能量吸附:这两种不同自旋方向有2个不同的能级,一低一高。能级差与磁场强度成正比。低能级可以吸收无线电波形式的能量跳跃到高能级状态。P44能量辐射:高能状态下的原子核回到基态并释放一定频率的无线电波。这一频率就是要测量的“共振”频率。P45自旋核在外加磁场中的取向(旋转方向)::取向数=2I+13P1在没有外磁场时,自旋核的取向是任意的,并且自旋产生的磁场方向也是任意的.1H核:H的I=1/2,则:自旋取向数=2×1/2+1=2如果把H核放在外磁场中,由于磁场间的相互作用,氢核的磁场方向会发生变化:与磁场一致或相反脉冲傅立叶变换核磁共振谱::3P5射频脉冲,接收线圈中可以产生时间域自由感应衰减信号(FID)就是波越来越小还有一个傅立叶转换见小纸时间域对应的还有频率域,频率域的核磁图谱成单峰状。protonNMR质子NMR:每一种原子核都可以吸收或释放不同频率的Rf(无线电波)。按某种标准测量化学位移(ppm)。一个原子的化学位移依赖于原子核的电子环境。3P6化学位移的定义::•核磁共振的共振条件是ω=γH0。同一种原子核,由于旋磁比相同,因而在相同外磁场下只应有一个共振频率。同一种核在分子中不同化学环境下共振频率的位移称为化学位移化学位移产生的原因::无语无奈无结构3\nByJasonWan原子核处于分子内部,分子中运动的电子受到外磁场的作用,产生感生电流。这一感生电流在核上产生感生磁场,感生磁场与外磁场相互叠加,使核上受到的有效场发生变化。我们把这一现象称为核受到了屏蔽。屏蔽作用的大小可用屏蔽因子σ来表示:Btotal=B0-σB0=(1-σ)B0•抗磁性物质•顺磁性物质化学位移的表示方法::•实际工作中测量的都是相对的化学位移,即以某一参考物的谱线为标准。最常用的参考物是四甲基硅(CH3)4Si,简称TMS•因为化学位移的大小与磁场强度成正比,为了比较在不同场强谱仪的化学位移,实际工作中常用一种与磁场强度无关的,无量刚的值,δ,来表示化学位移的大小•高频越大,相对化学位移越大蛋白质的化学位移是由周围相邻残基的性质决定的。精细结构源于自旋-自旋相互作用。怪怪的见PPT1吧。自旋-自旋相互作用::PS:原子核因内部的质子和中子具有固有自旋及其在核内的运动所呈现的磁矩称为核磁矩。两个核磁矩通过共价键传递的相互作用是形成液体谱精细结构的原因。自旋耦合一般只能通过2-3个共价键自旋耦合常数是自旋偶合会产生共振峰的分裂后,两分裂峰之间的距离(以Hz为单位)。偶合常数与化学位移的频率差不同,J不因外磁场的变化而变化,受外界条件(如温度、浓度及溶剂等)的影响也比较小,它只是化合物分子结构的一种属性。自旋相互作用::J-耦合不懂!讲了一堆大概J-耦合的重要性吧3P15通过电子轨道进行标量的各项同性的相互作用。弛豫过程::•如果由于某种原因系统已经偏离平衡态,那么经过足够长时间系统总能恢复到平衡态。在物理学中,常常把恢复平衡过程称为弛豫过程•原因在于系统同周围环境有相互作用核磁共振中的弛豫过程::•自旋-晶格弛豫过程:自旋系统同周围环境的能量交换,T1是一个用来表征自旋-晶格弛豫过程快慢的时间常数,称为自旋-晶格弛豫时间,也称纵向弛豫时间•自旋-自旋弛豫过程:主要影响谱线的宽度。通常用T2表示自旋-自旋弛豫时间,也称为横向弛豫时间好的磁场强度可大大提高NMR图谱的分辨率:即图上的谱可以拉的很开,分的很清晰。二维核磁共振图谱:一维是经过一次FT傅立叶转换,二维是2次FT,F(t1,t2)→→F(ω1,ω2)二维NMR的实验过程略看不懂,可以找教材3P21记录的是时间域的二维信号S(t1,t2),经二维Fourier傅里叶变换即得频率域的二维核磁共振谱S(ω1ω2)堆积图方式表示的二维谱。2DNOESY二维NOE谱:0.5mMLysozyme90%H2O10%D2O50mMNaCl多维异核核磁共振(HSQC)=异核单量子相干2-DNMR::15用另外一个原子标记例如N,同时激活两种原子核,从每一个图上观察共振结果,得到它们之间关系,说明它们是Coupled。偶联的?heteronuclearsinglequantumcoherence(HSQC)spectra谱结构测定::3P261)标签标记:常用同位素标记2)NuclearOverhauserEffect(NOE)欧沃豪斯效应来测量穿越空间ThroughSpace的距离PS:去偶可使信号增强的效应叫欧沃豪斯(NOE)效应。使信号增强的倍数叫NOE因子。3)收集这些距离限制条件,用来建立结构模型。4)用计算机建立符合这些条件的结构模型举例!化学位移分配&连续分配&二级结构特征&从限制条件到结构(限制的分子动力学和模拟退火)完全不懂!!!主要讲TOCSY全(总)相关谱与NOESY二维NOE谱。NOE给出化学键不相邻而空间相邻的质子消息。核磁共振波谱技术•PDB数据库中15-20%结构由NMR测定•PDB数据库中,NMR测定的结构75%无晶体结构•精度相当2.0-2.5Å的晶体结构•预期上限60-70KDa•发展迅速,国际上给以极大重视满足细胞中分子调节作用的功能要求,细胞中蛋白质相互作用的特点:低亲和力,是动态的,核磁共振波谱的优点在接近生理条件下研究蛋白质相互作用;特别适合研究低亲和力的瞬态的复合物结构信息,动力学信息无语无奈无结构4\nByJasonWanNMR在生物大分子上应用优越性::•不需要结晶•蛋白质三维结构测定,原子分辨率下的结构与功能研究•动态结构:溶液中,研究分子柔性与运动性及其它分子相互作用,测出一系列比较稳定的结构•复合物结构测定,分子识别•膜蛋白结构,已成功地用于菌视紫质及有机溶剂中细菌F1F0-ATP酶的F0膜功能区的C单元的结构解析。NMR的缺点::•NMR:必须同位素标记;数据处理复杂•目前最大MW分子量30KD,260个残基•要求蛋白没有聚合,而且折叠良好,蛋白浓度高,量大,比较稳定•没有X-线衍射的分辨率高,核磁谱仪非常昂贵•有受时间限制步骤:数据的收集和处理需要若干周,1NMR数据集/月,对a600MHz核磁谱仪来说•需要新手段(TROSY)and高场强的核磁谱仪•20%HSQC谱图才能解出NMR结构2.电镜三维重构(electronmicroscopy)的示意图(用的少)三维重构的基本原理(中心截面定理)将电子显微图像(实空间)进行傅里叶变换(倒易空间),一张显微图像的傅里叶变换相应于成像物体在三维傅里叶变换(倒易空间)的一个通过中心的截面。通过改变生物样品在电镜下的倾斜角度,就可以得到相当于傅里叶变换(倒易空间)的其它通过中心的截面。收集在不同倾斜角度下样品的显微图像,经过傅里叶变换就可以获得一套完整的三维倒易空间数据。对样品的三维倒易空间数据进行傅里叶逆变换运算就可以获得该样品在实空间的三维结构图像。电镜三维重构的基本步骤:•分离、纯化(包括蛋白质二维晶体的生长)•电镜样品的制备高分辨电子显微像的拍摄–样品的多角度照相–低剂量曝光技术(Low-Dose):聚焦和照相不在同一个样品区域–低温电镜技术:电镜中样品的温度维持在-160℃左右•像的数字化•数据处理及计算机三维重构•三维结构的解释(构建原子模型)样品制备:•二维晶体•负染•糖包埋•单宁酸(TannicAcid)包埋•冰包埋电子衍射图包含的信息::•衍射点的位置---〉晶胞的大小和形状•衍射点强度及背景的强度---〉信噪比•最远能分辨的衍射点---〉分辨率•Thonring索恩环?---〉离焦值•椭圆Thonring---〉像散值1.电子显微学研究生物大分子结构的主要方法见ppt2页哈电子晶体学步骤见ppt3页哈~电子晶体学的优势:1.可以直接得到膜蛋白的结构信息以及与膜相关蛋白在膜上的结构信息。2.可以获得高分辨率的结构,尤其适用于难于三维结晶的膜蛋白。2.单颗粒技术(SingleParticleTechnique)近年来迅速发展起来的单颗粒方法(SingleParticleTechnique)是生物电子显微学的新方法,它克服了晶体学的限制。顾名思义,单颗粒方法是对分离的,非有序排列的,但是相同的颗粒进行结构解析。其所采用的基本原理是通过对相同的生物大分子某方向的投影显微像在实空间中经过调整后进行叠加平均,从而提高信噪比,使粒子中共同部分的结构信息得到加强,最后对各种不同投影方向的单颗粒显微像在三维空间中进行重构,从而获得单颗粒大分子的三维结构信息。由于它处理的是同一大分子随机散布的电镜照片,所以没有形成晶体的要求。另外,单颗粒方法处理的生物大分子没有质量上限,而且分子越大,结果越好。单颗粒技术的优势::1.不需要二维晶体;2.适于解决生物大分子复合体系的结构应用举例:用单颗粒技术研究核糖体(ribosome)的结构及其功能机制。3.电子断层成像术(ElectronTomography)::过程见ppt4页哈~无语无奈无结构5\nByJasonWanElectronTomography的优势:1.适于解决不具备周期性或全同性的生物大分子复合体系的结构;2.适于揭示亚细胞层次的复杂结构。3.需要的量特别少,甚至只要一个分子就可以。电镜三维重构的效果:目前所能达到的分辨率?二维晶体:3.5~1.9Å?单颗粒:9~4.5Å?电子断层成像术:40Å4.DockingTechnique:翻译不详见ppt5页哈~把X射线晶体学的原子分辨率结构与电子显微术的分子分辨率结构结合起来构筑细胞基本结构体系!电镜三维重构发展趋势•分辨率=>原子(包括晶体和非晶体样品)•动态过程•结合其它学科:生物信息学、蛋白质晶体学•自动化:样品准备、数据收集、数据处理电镜三维重构的优越性•要求的量很低,可以直接获得分子的形貌信息,即使在较低分辨率下,电子显微学可给出有意义的结构信息•适于那些不适合应用X射线晶体学和核磁共振技术进行分析的样品,如难以结晶的膜蛋白,大分子复合体•适于捕捉动态结构变化信息•易同其他技术相结合得到分子复合体的高分辨率的结构信息•电镜图像中包含相位信息,分子量不受限;•对于单颗样品不需结晶,能够测定低分辨率的结构;对于不能生长三维晶体,但可以获得二维晶体的样品,微米量级的晶体可用于结构分析;分析生物大分子复合物结构具有一定优势;也是研究细胞器和亚细胞器的重要工具。电镜三维重构的缺点•但蛋白质的二维结晶至今仍然是非常困难的。•单颗粒技术在核糖体等用传统技术不易研究的大分子复合体结构研究中作用尤为突出。目前单颗粒样品解析最好的分辨率已达到1nm左右,但需要积累大量的数据(近10万个颗粒的图像),•限制单颗粒技术分辨率的主要因素是样品的均一性•另一个原因是定位颗粒的投影方向时存在误差•结构解析对大多数样品不可能达到原子分辨率的水平•仪器昂贵,收集数据的时间长•电子辐射导致样品损伤•数据处理复杂3.X射线蛋白结晶学/晶体学一种直接的实验技术:蛋白质或DNA样品:纯化&提高相对丰度;结晶:单个&保证质量;衍射及数据收集;相数:不明?phases:unknown;改进并建模:计算,消耗时间;结构-功能。X射线晶体学:是一种直接的实验技术,充分利用晶体衍射的X射线。这晶体学可以可靠的解答很多结构相关的问题,可略(从球状折叠globalfolds,ligand配基substratebinding基质连接/键,到atomicdetailsofbonding键的原子细节)X-raymacromolecularcrystallography:X射线大分子晶体学:用X射线晶体学来理解大分子结构和功能的方法,大分子例如蛋白质和DNA。精确的分子结构是合理的药物设计和对结构决定功能研究的前提。晶体生长现象::从溶液中结晶是一个很普遍的自然现象,对于小分子、无机盐、水溶性蛋白和膜蛋白而言,结晶的原理都是相同的。为了使体系发生结晶,必需通过改变一个或者更多的物理参数如浓度、温度、离子强度等来达到溶液的过饱和状态。通常而言,这个过程变化越缓和,结晶过程就越好控制,高度有序的晶体就更易于得到。结晶包括两个连续的过程:成核和晶体生长。成核过程是一个可逆的过程。当晶核长大到一定程度时,它将进一步不可逆地长大,形成一个新相,进而形成稳定的晶体。从微观角度而言,每一个分子具有六个自由度,三个水平和三个旋转自由度,它们通过有序的堆积使体系的熵减少。在蛋白经过有序堆叠形成晶体的同时,相邻分子间形成新键,进而降低体系的自由能,这是形成结晶的驱动力。蛋白质的不稳定性和很大分子量使得结晶变得非常困难,而且生物大分子要求的条件非常温和,以减少生物大分子变性.三步骤:1。晶体生长2。衍射测量3。解决相位和改善优化结构4P18X射线衍射:4P20衍射得到一系列反映,其中每个点的位置和强度表明了蛋白晶体的信息,利用这些信息,通过模拟数学计算获得电子密度图。电子密度图:是电子密度区域衍射了X射线,建立一个蛋白质晶体的电子密度图,它能帮助我们了解蛋白质序列。一般要求解出的结构可接受的剩余值约20%关于分辨率的问题:分辨率由晶体有序度决定的,PDB里的结构只是模型,分辨率越好模型越好,分辨率定义:可以分辨二个平面的最小距离。无语无奈无结构6\nByJasonWan关于X射线衍射小总结:电子密度衍射X射线,由衍射所得到的回应可以用来计算电子密度图,利用这密度来构建蛋白模型,晶体大小所要求的光源:mm级(一般X-光源);0.02mm(同步辐射光源);相位问题:同晶置换、分子置换、直接法、多波长反常散射、同晶差值傅里叶法等。X-射线晶体衍射的优越性::•技术比较成熟•能够达到非常高的分辨率,1埃•占已知结构的80%以上,目前所有重要的蛋白几乎都是X射线方法解出的•几乎没有分子量的限制,200万以上•晶体含约40%-60%水,基本上可视为自然状态下的结构•收集数据快,可以全自动化•可以长出膜蛋白晶体X-射线晶体衍射缺点::•必须长出晶体•长晶体过程是艺术,不被认为Science就是说它难……囧……•制备大量纯化的蛋白质(>10mg),•晶体易碎,也容易使蛋白质分子在晶格排列上有不规则的情形出现,造成晶体处理时的困难及衍射数据上的搜集不易等缺点;样品的分子体积太大(7.5nm),衍射点可能重叠•由于空隙中水分子排列比较紊乱使得大部分结构的分辨率约在2.0至3.0Å•蛋白质结构的静态快照,没有动态中间物•复合物晶体比较难长无语无奈无结构7\nByJasonWan第三章蛋白质晶体学&第四章蛋白质晶体结构的解析注意!蛋白质表达为非重点!!第一节蛋白质的表达与纯化::基因工程表达体系根据受体细胞的不同可分为:(1.原核表达系统:将外源基因引入原核细胞,并使其在原核细胞中以发酵形式快速高效地表达、合成基因产物的体系。(2.真核表达系统:使外源基因在真核细胞中表达的体系。1.原核体系的特点::(1.原核生物染色体DNA是裸露的环形DNA,其转录和翻译是偶联的连续进行。(2.原核生物形成多顺反子mRNA:mRNA在合成过程中和多个核糖体结合,翻译形成多条肽链。(3、一般不含内含子(intron),没有转录及翻译后加工系统(4、原核生物中功能相关的基因串联在一起,形成操纵子。1.1大肠杆菌(Escherichiacoli)•最常见、最广泛应用的蛋白质表达方式•遗传背景清楚,基因工程操作方便,商品化表达载体种类齐全,表达效率高。缺点:有些不表达,或者基本不分泌,易形成包涵体(无正确折叠的立体结构),无加糖等修饰。1.2枯草杆菌(Bacillussubtilis)•分泌蛋白质能力强,一般有天然立体结构缺点:无加糖修饰功能,培养液中蛋白酶活性高,重组蛋白易受蛋白酶的水解质粒不稳定,尚无商品化的表达载体1.3其它•乳酸菌(Lacticacidbacteria)•沙门氏菌(Salmonellatyphimurium)•苏云金杆菌(Bacillusthuringiensis)外源基因在原核表达系统中表达的必要条件::1.删除内含子和5’非编码区2.外源基因置于强启动子和SD顺序控制下3.维持正确开放阅读框架(ORF)4.一般要删去信号肽5.mRNA稳定且可有效转译,形成的蛋白质不被降解原核表达系统的缺点:(1没有转录后加工系统,不能识别、剪除内含子(2缺乏翻译后加工系统,不能对翻译的蛋白质进一步修饰加工2.真核细胞表达体系::•酵母细胞•昆虫细胞•哺乳动物细胞/组织•植物细胞/组织真核表达系统的重要性及优势::1.具转录后加工系统2.具翻译后修饰系统3.可实现真正的分泌表达4.基因治疗2.1酵母细胞:•优点:可生产分泌型蛋白;有天然立体结构,有加糖修饰功能;可进行染色体整合型基因表达;•缺点:糖链与哺乳动物加工的不一致,培养上清多糖浓度高;•商品化表达体系:?酿酒酵母(Saccharomycecerevisiae);?毕氏酵母(Pichiapastoris);?裂殖酵母(Schizosaccharomycepombe)蛋白质在酵母中的表达:克隆目的基因到载体上,转移载体到酵母,培养筛选具有抗性的酵母系,培养得蛋白产物。2.2昆虫细胞::•可以病毒感染的型式在成虫中生产,也可在体外培养细胞中生产蛋白;•适合分泌型和膜蛋白的表达,有加糖修饰;缺点:•糖链与人体蛋白有所区别,表达量有限;•作为药物宿主细胞未被FDA认可。克隆目的基因到pFastBac载体上,用杆状病毒质粒转化,两者重组后,转染昆虫细胞,在昆虫细胞中,病毒进行装配,病毒在昆虫细胞中产生蛋白产物。表达系有:Sf9,Hi5,Sf212.3哺乳动物细胞/组织::CHO细胞(中国仓鼠卵巢细胞)优点:•可进行分泌表达,有天然立体结构,加糖方式与人体蛋白质完全一致;缺点:•表达量不够高,培养成本较高。瞬时表达:目的基因连到重组质粒上,用PEI转染293E细胞,获得用来提纯蛋白的细胞。293E细胞在悬浮培养基培养,蛋白质生产的无细胞系统::Cell-freeSystemforProteinProductionRapidTranslationSystem(RTS)快速表达系统:快速的蛋白质表达,有时可以生产细胞表达系统不能以可溶形式表达的蛋白,即快速表达系统可以表达可溶的蛋白。有毒性的蛋白也可以表达,具有很高的收益。动物乳腺组织:优点:•分泌生产有天然立体结构和活性的蛋白质至乳汁,产量高,分离纯化方便,特别适合药用蛋白的生产;缺点:•转基因动物制作花费巨大,实验周期长。鸟类输卵管组织:优点•分泌生产有天然立体结构的蛋白质到蛋清,产量高,容易贮存和运输,分离纯化方便;实验成本低,饲养费用低;•缺点:•加糖方式可能与人有所不同。无语无奈无结构8\nByJasonWan2.4植物组织优点•植物可大面积种植,可以廉价大规模生产;•转基因植物制作费时,表达的组织特异性较难控制;缺点•表达量较难提高,分离纯化不方便。3.体系选择•研究基因功能:•疫苗:大肠杆菌,酵母,大多数沿用细胞培养产物进行灭毒大肠杆菌,裂殖酵母,昆虫细胞,CHO细胞•单抗生产:杂交瘤细胞•多肽药物生产:•工业酶生产:各种微生物大肠杆菌,毕氏酵母,CHO细胞,乳腺组织现在及未来可实现目标略哈,见5P403.1在大肠杆菌中表达外源基因大肠杆菌表达载体分类(没用吧……)按蛋白质类型分:按启动子分:•单纯表达:pJLA系列,用NcoI/NdeI导入AUG的载体•lac及衍生的tac,trc,pac,rac等启动子IPTG诱导•融合表达:含有各种Tag:GST,SUMO,TRX,PET,CBD,MAL,•lamdaphagePL和PR启动子热诱导GFP,etc•T7启动子IPTG诱导•分泌表达:pel/ompT分泌肽•T5启动子IPTG诱导•ara启动子阿拉伯糖诱导常用表达载体还是没用吧…………:•pMAL系列(周质表达,BioLabs公司)•pET系列(T7promoter,Novagen公司)•pJLA50X系列pcDNAIIetc•pGEX系列(GST融合表达,Pharmacia公司)•pQE系列(T5promoter,Qiagen公司)•pTYB系列(CBD融合,可以自我切割,BioLabs)•pBAD系列(Arabinose诱导型)各种融合蛋白的TAG见PPT6哈~各种可用于抗体识别的标记略见5P46有前景的特殊用途的tag::这个不会考吧……•Biotinylation-tag:100多AA的结构域,在大肠杆菌中被识别为生物素化的位点.Promega的PinPointTMXa-1;Invitrogen的pET104-DEST.•多肽片段1:DVEAWLGAR被用来和Streptoavidin结合。•其它多肽片段:如一些病毒外壳蛋白的片段,破坏细胞膜的结构导致容易进入细胞。融合蛋白的专一性切割略哈~见5P48常用的表达菌株::不靠谱……•BL21(DE3)/pLysS:自身含有表达T7RNApolymerase适用pET系列等带T7启动子的载体•Rosette(DE3):适合表达含有稀有密码子的菌种•BL21TrxB(DE3):thioredoxinreductase突变•Origami:thioredoxinreductase/glutathionereductase双突变适合带thioredoxinreductase的融合表达载体,帮助形成更多的二硫键•BL21CodonPlusRIL:富含AT的真核生物基因的表达•BL21CodonPlusRP:富含GC的真核生物基因的表达一些蛋白质表达时的规则::•如果所表达的蛋白质有二硫键并需要正确的立体结构,尽可能进行可溶性表达;•如果所表达的蛋白质没有二硫键或只用来制备抗血清,采用包含体表达比较好;•如果希望表达的多肽的分子量小于10kDa,一定要进行融合表达。3.1.1让表达产物可溶化:•采用MBP融合•采用GST融合•采用CBD融合•采用thioredoxin(硫氧还蛋白)融合•采用SUMO融合•采用Origami等宿主菌•降低菌体培养的速度(温度诱导(15-30℃),降低转速)让蛋白质分泌到间质去::•采用CBD融合(pET36/37)•采用Dsb融合(pET39/40)•采用带pelB/ompT引导肽的载体(pET12/20/22)•采用带MBP融合(pMAL载体,Biolabs)•采用带SUMO融合(pETSUMO,Invitrogen)纯化方法:先用EDTA/蔗糖溶液处理,然后5mMMgSO4洗出3.1.2包含体的复性::•透析法:简单,但费时、费缓冲液,蛋白质浓度不能过高(容易产生沉淀)•快速稀释法:最常用的小规模复性方法;但费时、费缓冲液,蛋白质的浓度不能高(容易产生沉淀)•超滤透析法:比较省缓冲液,处理量大;但费时、要控制好蛋白质浓度•凝胶过滤法:快速,可重复性高,不会产生沉淀,操作复杂一点•亲和层析复性法,水相二相法无语无奈无结构9\nByJasonWan实验中常遇到的问题::•表达量不够高;答:3.1.3尝试不同表达载体,特别是N端有融合蛋白的载体•包含体在8M尿素中不能溶解;答:•是不是忘了加还原剂(DTT或巯基乙醇)?•是不是在-20℃冻存过?•用4M盐酸胍试试!•重组蛋白在大肠杆菌中表达的分子量偏小;答:•是不是酸性蛋白质?•是不是蛋白质的合成提前中止了?(富含Arg,Ile,Leu,Pro这几种氨基酸)•可以尝试用Rossetta,BL21CodonPlusRIL或RP作宿主菌(Stratagen);•使用C端带His-tag的融合表达载体(如pET23,Novagen)以便纯化全长的融合蛋白•带His-tag重组蛋白不吸附到Ni-chelating树脂上;答:•His-tag被操作过程混入的重金属离子所饱和,可以通过添加0.5mMEDTA来去除重金属离子的干扰;•His-tag被包裹在不易和树脂发生结合的位置(比较罕见)•其他不明原因导致弱结合•Ni-chelating分离纯化的效果不好;答:•样品没有很好细心去除不溶性物质•重复使用前树脂没有洗干净•蛋白质之间存在相互作用•可以提高盐浓度,改变pH,添加2-6M尿素等方法来洗去杂蛋白质•GST融合蛋白不吸附到glutathione-Sepharose上;答:是不是在进行复性时用了Redoxbuffer氧化还原缓冲液•包含体来源的采用透析法或稀释法复性时全部沉淀;答:尝试用Ureagradient尿素梯度/Gelfiltration凝胶过滤来解决•Ni-chelating错用DTT后发生黑色沉淀该怎么办?答:尽快用0.1NHCl冲洗•贵重的亲和层析树脂经常发生结块该怎么办?答:用0.1NNaOH/0.1%SDS洗•某些表达载体的表达效率在放大培养时无法提高答:主要是溶氧量的问题,可以通过在摇瓶中加入不同量的培养基的方式来确定最佳体积基因克隆的技术路线::见PPT7哈~基因的表达:基因工程中用来获得有功能的异源蛋白质的体系,包括克隆载体,表达载体及受体细胞。外源基因的表达:1、胞内表达2、分泌表达:在MCS前加入信号肽序列接下来举例了!!!!ETSHR-6蛋白的表达和纯化!克隆目的基因:细胞内DNA-MRNA前体-MRNA.---分离纯化RNA(总DNA+RNA—通过oligo(dt)亲和层析—得mRNA),---合成cDNA(反转录酶+dNTPs+oligo(dt)—mRNA与cDNA杂合链—碱降解mRNA—得发卡做引物+DNA聚合酶Ⅰ+dNTPs—得发卡+核酸酶S1降解发卡—得双链cDNA。)——PCR:起始94℃5min,终止72℃10min,10℃10s5’引物和3’引物要加酶切位点。循环步骤:变性—退火—延伸。2+需要:dNTPs+TaqDNA聚合酶+Mg连接载体:PCR产物+质粒载体+内切酶切--+T4DNA连接酶14℃12hr—转入大肠杆菌(转化)培养:培养基:LB或M9配方略哈见5P82转化:步骤很简陋也很怪:正常大肠杆菌细胞CaCl2处理0℃(制感受态?),0℃下质粒与感受态细胞表面接触,热击42℃90s,37℃培养1h激活重组质粒。质粒提纯方法:PromegaWizard®PlusSVMiniprepsDNAPurificationSystem离心—去培养基—重新悬浮细胞—裂解细胞—碱性蛋白酶(pH≥9,内切酶失活,不特异性降解蛋白质)--中和—离心去除裂解物—加入回收柱中—吸附DNA—洗脱DNA—用水稀释选择一个大肠杆菌株系:无核酸酶的用EB法进行DNA半定量分析-----琼脂糖凝胶电泳----DNA测序诱导:乳糖操纵子—诱导物IPTG---T7RNA聚合酶—•T7启动子是当今大肠杆菌表达系统的主流,这个功能强大兼专一性高的启动子经过巧妙的设计而成为原核表达的首选,尤其以Novagen公司的pET系统为杰出代表。•强大的T7启动子完全专一受控于T7RNA聚合酶,而高活性的T7RNA聚合酶合成mRNA的速度比大肠杆菌RNA聚合酶快5倍——当二者同时存在时,宿主本身基因的转录竞争不过T7表达系统,几乎所有的细胞资源都用于表达目的蛋白;诱导表达后仅几个小时目的蛋白通常可以占到细胞总蛋白的50%以上。无语无奈无结构10\nByJasonWan•由于大肠杆菌本身不含T7RNA聚合酶,需要将外源的T7RNA聚合酶引入宿主菌,因而T7RNA聚合酶的调控模式就决定了T7系统的调控模式——非诱导条件下,可以使目的基因完全处于沉默状态而不转录,从而避免目的基因毒性对宿主细胞以及质粒稳定性的影响;通过控制诱导条件控制T7RNA聚合酶的量,就可以控制产物表达量,某些情况下可以提高产物的可溶性部分。SDS-PAGE:?separatinggel分离胶stackinggel浓缩胶?1.4gSDS/gproteinlgMr=K-bm?constantvoltage=80V胞质可溶蛋白&包涵体蛋白::胞质可溶蛋白溶解于水中,是自然状态下的蛋白质;包涵体蛋白溶解于8M尿素或6M盐酸胍,变性——复性小剂量诱导:Small-scaleinduction:LB(100mg/LIPTG,OD600=0.80)Optimalexpressionconditions:≥5~6hr?M9(100mg/LIPTG)Optimalexpressionconditions:OD600=0.7~0.8,~12hr大剂量表达和提取:细胞中有胞质可溶性蛋白、包涵体蛋白+细胞裂解缓冲液+冻融1-2次—离心—上清有胞质可溶性蛋白、沉淀有包涵体。包涵体加入8M尿素pH8.0–超声波处理(200W,5~10times,20s/time)---离心—上清包涵体蛋白,沉淀细胞碎片和DNA片段。Ni-NTA金属螯合亲和层析::Ni-NTA:nickel-nitrilotriaceticacid亲和度比抗原抗体还强,比酶-底物作用还强,是不依赖于构象的结合5~10mg6×His-taggedprotein/mLNi-NTAresin对胞质可溶性蛋白:::蛋白上有组氨酸,组氨酸上有咪唑基;咪唑与NI-NTA结合竞争组氨酸与NI柱结合,从而洗脱下来。自然状态下的蛋白质,::放pH=8的磷酸缓冲液300mMNaCl(高盐减少非特异性结合)20mM的咪唑中。过Ni柱,有穿柱液和洗脱液(250mM咪唑)得到纯化6×His-tagged组氨酸标签的蛋白。结束。对包涵体蛋白:::在6×His-tagged组氨酸标签的蛋白中pKa≈6.0(酸性或质子浓度),降低pH值,在pH≈4.5~5.3时,使其质子化。变性的条件下::放pH=8的磷酸缓冲液8M尿素。pH=8.0,pH=6.2~6.3得穿柱液,PH=4.1~4.2得6×组氨酸标签的蛋白.通过洗脱图谱OD280可以算出含量OD280=0.2894,~70mL0.2894×70mL/0.8mg·mL-1=25mg最后调整PH=7复性手段::复性缓冲液:100mM磷酸缓冲液pH=7.0);50~100mMNaCl;redoxagents氧化还原剂方法:透析(慢);缓慢稀释;快速稀释法。不懂怎么的,就选10mMDTT(Ⅰ,Ⅱ,Ⅲ)貌似可以用在各种复性方法里。二硫苏糖醇(DTT)提纯和浓缩::·Ultrafilter=超滤法:优势:提纯,除盐和浓缩。不足:可能出现膜污染&浓差极化(不懂就百科)插曲:Thrombin凝血酶对GST融合蛋白进行降解—不降解跑胶时,蛋白量巨大,一坨一坨的。一个牛逼机器进行3D系统平行蛋白纯化,所得图的峰:空隙体积六聚体二聚体废物ATP/ADPDTT六聚体和二聚体保持动态平衡。纯化过的产物只有一个大峰。3.2重组杆状病毒的产生和Bac-to-Bac®系统的基因表达::简单说:目的基因连到pFASTBac载体,转大肠杆菌,抗体选择出发生基因同源重组的菌(目的基因连到大肠杆菌的基因组)--重组基因组转染到杆状病毒,血球计数达到标准,杆状病毒表达蛋白。3.3制备用于结晶的蛋白质复合体1.蛋白-蛋白复合体的表达和纯化:a.蛋白质分别表达b.蛋白质在一个细胞共同表达。2.蛋白质-核酸复合物:蛋白质-RNA;蛋白质-DNA蛋白-蛋白复合体的表达和纯化::方法:通过在大肠杆菌体内重建,获得重组蛋白复合体1.利用兼容载体如paCycduet(p15Aori)和pET15B(pBR322ori)有(不同ori,抗性不同)2.利用有多个表达片段即多顺反子的一个载体(一般各个表达片段都有各自的启动子如paCycduet,petduet)体内重建/共表达的优势:高效:只须一次表达一次纯化即可。品质好:在细胞分子伴侣存在情况下进行多肽的共表达和共折叠,可以增加功能复合体的产量。蛋白质——DNA复合物::1.一般蛋白质溶解度在高盐缓冲液下溶解度高2.蛋白质—DNA复合体的稳定度比单个蛋白稳定3.用于结晶的DNA长度和序列:a.附加碱基对b.粘性末端4.DNAoligos(寡聚DNA?)的提纯:利用疏水作用或C4的HPLC(高效液相色谱法)5.Trappingreactionintermediate捕获反应中间体?:二硫键;蛋白质点突变,etc;6.蛋白质—DNA复合体准备:与额外mol的DNA混合7.结晶化:PEGorMPD在低盐缓冲液中;8.Example:over6000trialforprotein-DNAcomplex.无语无奈无结构11\nByJasonWan蛋白质—RNA复合体Protein-RNAComplex::困难:防止RNase降解;磷酸基团干扰晶体packing(形成);伸长的RNA包裹成晶体是很疏松RNAengineering:平端或粘性末端,缺失,替换等RNApreparation:1.Synthesis;合成2.Invitrotranscription;体外表达3.4ProteinModificationforCrystallization为实现晶体化的蛋白质修饰1.Proteininhibitor,partnerandmonoclonalantibody;蛋白质抑制子,伴侣,和单克隆抗体2.Proteinpost-translationalmodification;蛋白质翻译后修饰3.Proteinmutagenesis:truncation,mutation,deletion蛋白质诱变:蛋白质断裂,突变和缺失蛋白质诱变::断裂或缺失:影响二级结构预测,DXMS结果,同源蛋白序列比对或结构比对。突变方法:选择性点突变;随机突变大剂量高通量蛋白质表达和提纯:依赖于:有大量的蛋白序列数据,可行的DNA重组技术,高级蛋白质表达系统的构建(cDNA克隆、表达载体、产量大纯),高质量蛋白的过表达。一般的蛋白质提纯方法:每一种蛋白各不相同,一个一致方法是可以利用His-orGST-Tags;蛋白质工程技术:修饰的蛋白质增强了得到高质量结晶的可能性,使大分子研究更加高效X射线晶体学:可溶的,Se-Met富含的蛋白质forMADMAD??某种晶体结构测定方法NMR:可溶的同位素标记的蛋白生物物理学来检测样品的品质:利用动态光散射dynamiclightscattering,CD,MS,等适于晶体生长和NMR分析的蛋白质样品的制备::基因表达产物或天然蛋白质进行-----蛋白质分离纯化值得注意的两点:1。利用基因分子生物学和生物化学手段制备“蛋白质”样品是现代蛋白质晶体学学科的基本组成部分。2。“蛋白质”样品结晶对其微观均一性有特别的要求。适于晶体生长的蛋白质样品的制备::利用基因分子生物学和生物化学手段制备“蛋白质”样品是现代蛋白质晶体学学科的基本组成部分。天然蛋白样品的稀缺,无法满足晶体培养的需要,只能依赖基因表达。基因表达产物的重量:低表达量--微克级、中表达量--毫克级、高表达量--克级完整的蛋白质氨基酸残基序列测定的需要。晶体结构测定方法(例如MAD法)的特殊需要:S--〉Se硫变硒MAD法已经是解决晶体衍射相位问题的主要方法之一,主要原因是:高亮度同步辐射光源的普及、高通量晶体结构测定的需要、自动蛋白质晶体测定的需要。和上面分开人们对结构研究与功能研究课题的关注程度与迫切性是有区别的。关于待结晶的“蛋白质”样品,有“两个均一”的特别要求:化学组成均一&分子构象均一蛋白质晶体内部结构为三维周期有序重复排列,要求每个结晶重复单位(分子或其复合体)的化学组成与分子构象是均一的。第二节蛋白质晶体学重点!!!!!!!总纲:1.蛋白质的结晶和晶体生长[主要内容]:蛋白质结晶的原理、技术和方法、对材料的要求、晶体生长的理化条件、晶体的鉴定。2.晶体学基本概念3.衍射数据的收集[主要内容]:晶体的收集与冷冻处理;X射线源的选择;衍射线记录装置及其使用方法;衍射数据收集的全自动化。4.蛋白质结晶结构的解析[主要内容]:蛋白质晶体空间群(Spacegroup);相位(Phase)的测定;电子密度图的解释;结构模型的修正与精化。5.pdb数据库文件以及结构的三维显示流程:蛋白质表达和纯化---结晶----数据收集---结构解决方案structuresolution---电子密度图谱解释-构建模型---结构优化-确认----结构分析—生物意义X晶体衍射的快速生长:1.基因重组2.晶体越小,X射线作用越大3.自动检测4.快速便宜的计算机5.更好的算法和程序组6.更系统的生晶方法7.晶体低温储藏8.新的相位问题解决方法第一部分:蛋白质结晶::晶体大小:0.1-1.0mm蛋白质晶体必须是有序重复的模式ordered,repeatingpattern.工作流程:见上吧,生晶的过程还没见到,昝略X射线射到晶体上,不穿过镜头,直接衍射,连接到检晶器和计算机得出电子密度。无语无奈无结构12\nByJasonWan原理::为什么选择X射线?X射线的波长与C-C键长一个数量级与其波长接近cuka波长1.5418Å;只能观察到比波长大的物质通过高能电子撞击铜靶来产生X射线。其释放的不同波长的,其中一种叫CuKa,波长是1.5418Å,接近CC键距离,因此适合研究使用。为什么用电子密度?因为就电荷/质量来说(e/m):电子>>原子核或质子;电子加速可以产生电磁辐射。我们得到的结晶实验结果不是原子的图片,而是电子分部的图,即电子密度图。出现Thomson衍射&发射系数,见小纸;X射线晶体学是一种弹性衍射:可以是相同或改变了的方向。电子的核质比是原子核的电子甚至质子的2000倍。散射强度与核质比的平方成正比。无弹性散射:激活一个内层电子到高能状态。可以用来探测这种物质激活释放,但不能用于检测该物质内部散射分布为什么选晶体?大量的分子处于相同的方向。:单个分子的X射线散射不易检测到,因为有空气和水散射产生的背景noiselevel。大量分子的晶体排列在同一个方向,这样散射波可以在一个相位进行叠加,提高了可以检测的信号强度。晶体就像一个放大器。如果波在相位叠加,可以消除其他方向的波影响。这是晶体衍射图是一系列点的原因。检测晶体结构时有很多瓶颈,最大的是得到可用的晶体。得不到数据或得到坏数据,解决不了问题,因此好用的晶体非常重要。结晶!!!!::像艺术,利用物理手段理解结晶原理,反复尝试进行系统的晶体筛选,商业筛选设备,因素:浓度10-50mg/ml沉淀pH温度清洗剂添加剂金属?等重复知识点!!!蛋白质晶体内部结构为三维周期有序重复排列,要求每个结晶重复单位(分子或其复合体)的化学组成与分子构象是均一的。简要过程见ppt8哈~Supersaturation过饱和:加入比溶液正常能溶解物质的量还多的状态,是热动力学不稳定状态。一般通过蒸汽扩散或缓慢蒸发的技术获得蛋白质晶体。有三种区域:亚稳定区:长时间不会成核,但是可以维持晶体生长,这种常需要提供一个晶种。成核区:蛋白质晶体成核和生长。沉淀区:蛋白质不能成核,但是只有沉淀出来。*结晶条件::重点!为了获得某种蛋白的结晶,往往需要进行一些适当的预备实验摸索。1.蛋白的纯度:一般来说,蛋白越纯,越容易获得结晶,长成单晶的可能性也越大。除个别情况外,一般蛋白纯度应达到90%以上。2.蛋白的浓度:对大多数蛋白来说,蛋白质浓度在10~50mg/ml较好。一般来说,蛋白浓度越高,有利于分子间相互碰撞而聚合,但是蛋白浓度过高,往往形成沉淀;蛋白浓度过低,不易形成晶核。3.晶种有些不易结晶的蛋白,需加入微量的晶种才能形成结晶。在加入晶种前,要将溶液调整到适于结晶条件下,加入的晶种开始溶解,还要追加沉淀剂。直到晶种不溶解为止。当达到晶种不溶解又没有无定形物形成时,静置,使进晶体生长。4.温度结晶温度,一方面要有利于结晶的生成;另一方面要不超过蛋白的热稳定性。有些蛋白对温度很敏感,因此要防止蛋白失活。从现有资料来看,一般控制在0一4℃范围内,通常在4℃下。低温条件对蛋白不仅大部分的溶解度降低,而且蛋白不易变性。5.pHpH是蛋白结晶的一个重要条件。有时只相差0.2pH单位时,只能得到沉淀,而得不到结晶,所选择pH应在蛋白的稳定范围内,一般选择在被结晶蛋白酶的pI值附近。6.金属离子许多金属能引起或有助于酶的结品。不同酶选用不同金属离子.在酶结晶过程中常用Ca2+、Zn2+、Co2+、Ni2+、Cd2+、Cu2+、Mg2+、Mn2+等金属离子。在许多情况下,这些离子是酶表现活力所必滞的,它们能保持酶分子结构上的一些特点.7.其他除上述因素外,还有一些因素会影响结晶的形成。比如:需防霉,在结晶过程中不得有微生物生长,一般在高盐浓度或有乙醇时,可以防止微生物生长.在低离子强度的蛋白质溶液中,易生长细菌和霉菌。为此,所有溶液需用超滤膜或细菌漏斗过滤,加入少量的甲苯、氯仿或吡啶,可以有效地防止微生物的生长。又如.在结晶过程中,一般要防止蛋白酶的水解作用。蛋白酶水解作用常引起结晶的微观不均一性,影响结晶的生成和生长。气相扩散法(Vapordiffusionmethtod)•悬滴结晶法(hangingdrop)有利于得到大的晶体。只有少量样品而又要大量条件的情况。•其它方法•坐滴结晶法(sittingdrop)透析法、分批静置法、自由界面扩散法等。无语无奈无结构13\nByJasonWan如何生晶:开始纯蛋白10-50mg/ml,创造一个过饱和溶液,等待……一滴中包含1-5ul蛋白质,缓冲液,沉淀剂(有时其他添加剂)汽相扩散法的原理见ppt9哈~经典的微量透析法的原理见ppt10。11哈~影响蛋白质结晶的基本因素::第一类因素1。沉淀剂(能够引起蛋白质溶液饱和度变化的主要成分,包括盐类和有机试剂等)种类与浓度;2。蛋白质浓度;3。温度;4。pH值;5。添加剂(能够辅助沉淀剂引起蛋白质溶液饱和度变化,包括盐类和有机试剂等)种类与浓度第二类因素1。溶液中的杂质(包括少量的杂蛋白、残余的小分子物质等);2。待结晶的蛋白质的稳定性与均一性;3。外界环境振动;4。溶液汽相或液相扩散的速度;5。溶液中的灰尘等微粒;6。环境重力;摸索蛋白质结晶条件的基本思路::的大体思路是先设计一系列的大量初始条件来尝试晶体生长,一旦获得晶体(往往是微晶或晶形不好的晶体),再仔细地优化这种条件,直到获得可用的大单晶为止。1.鸟枪法,2。网格法,3。随机法,4。参考同类蛋白晶体生长条件法,几种方法见PPT12-20蛋白质晶体生长的接种法(seeding)没有内容。蛋白质晶体生长的共晶法(co-crystallizing)浸泡法(soaking)见PPT21-22结晶实验中的常用条件和思路见PPT23无用处Cyberlab蛋白质结晶仪(CyberlabC200andC240ProteinCrystallographyWorkstation)1.自动进行蒸发扩散法蛋白结晶.2.C200连续处理批量单一样品,C240同时处理96个样品.3.自动化、高通量蛋白质结晶.4.快速转移筛选试剂和蛋白质.5.消除人工的重复劳动、减少交叉污染.6.可处理低至0.5微升蛋白质或试剂.蛋白质初步鉴定和挑选见ppt24观察到的蛋白质晶体的实际外形具有多样性,同一种点白纸晶体的不同个体也是有差异的。适合于X射线衍射的蛋白质晶体::外形尺寸,衍射分辨率,抗X-射线辐照的能力,晶体内部结构的缺陷度,晶体是否为单晶,晶体抵抗外界环境变化的能力。同一种蛋白质可以在不同条件下生长成不同晶型的晶体;可以在不同的条件培养出同一种晶型的蛋白质晶体。蛋白质种类的不同对其晶体生长难度的影响是显著的常规的水溶性蛋白质;非常规的水溶性蛋白质:糖蛋白,巨分子量蛋白质聚合体,分子几何外形或表面性质极端“各向异性”的蛋白质——膜蛋白。。直接分离纯化的天然蛋白质;利用基因工程表达的蛋白质。。分离纯化的蛋白质的批次;同一种蛋白质的不同变种。第二部分晶体学一般概念:(Symmetry(对称)BraggEquation(布拉格方程)EwaldConstruction(爱华德构图法))非晶体是指组成物质的分子(或原子、离子)不呈空间有规则周期性排列的固体。它没有一定规则的外形,如玻璃、蜂蜡、松香、沥青、橡胶等。它的物理性质在各个方向上是相同的,叫“各向同性”微观:内部质点在三维空间不成周期性重复排列的固体。晶体:由原子、离子或分子在空间按一定规律周期重复地排列构成的固体。晶体具有如下性质::均匀性:晶体内部各个部分的宏观性质是相同的。各向异性:晶体种不同的方向上具有不同的物理性质。固定熔点:晶体具有周期性结构,熔化时,各部分需要同样的温度。规则外形:理想环境中生长的晶体应为凸多边形。对称性:晶体的理想外形和晶体内部结构都具有特定的对称性。晶体的点阵结构和晶体的性质见PPT之后大部分见ppt点阵的对称—32点群、230个空间群32个点群对称不考虑translation平移。可诱导对称的元素有:旋转,镜面对称,中心对称,倒置。空间群:所有对称操作的组合(32个点群),加上平移对称,和14种布拉维晶格,演变出230个空间群,用来描述相同对象在无限晶格中排列的唯一方式。onlywaysinwhichidenticalobjectscanbearrangedinaninfinitelattice.国际上表格列表上有:符号,数字,对称操作,起源,反射条件,空间群投射表。IntroductiontoSpaceGroup::数字!?7Crystalsystems晶体系?14Bravaislattices(布拉维晶格)?32Pointgroups?230Spacegroups生物大分子:仅限于非镜像和非倒置对称操作。只有65个手性chiral空间群表见ppt36.37倒易点阵:::3.1倒易点阵是在晶体点阵的基础上按一定对应关系建立起来的空间几何图形,是晶体点阵的另一种表达形式。1.定义式:a*·b=a*·c=b*·a=b*·c=c*·a=c*·b=0a*·a=b*·b=c*·c=1ReciprocalSpace无语无奈无结构14\nByJasonWan或用统一的矢量方程表示:2.倒易点阵与正点阵的倒易关系::•倒易点阵的倒易是正点阵。从倒易点阵原点向任一倒易阵点所连接的矢量叫倒易矢量,表示为:r*=Ha*+Kb*+Lc*倒易点阵概念及性质见PPT38晶向指数和晶面指数::•晶向:晶体中原子的位置、原子列的方向•晶面:原子构成的平面•Miller(密勒)指数统一标定晶向指数和晶面指数晶面指数标定步骤:1)在点阵中设定参考坐标系,设置方法与确定晶向指数时相同;2)求得待定晶面在三个晶轴上的截距,若该晶面与某轴平行,则在此轴上截距为无穷大;若该晶面与某轴负方向相截,则在此轴上截距为一负值;3)取各截距的倒数;4)将三倒数化为互质的整数比,并加上圆括号,即表示该晶面的指数,记为(hkl)。晶面指数的意义::晶面指数所代表的不仅是某一晶面,而是代表着一组相互平行的晶面。在晶体内凡晶面间距和晶面上原子的分布完全相同,只是空间位向不同的晶面可以归并为同一晶面族,以{hkl}表示,它代表由对称性相联系的若干组等效晶面的总和。•立方晶系中,相同指数的晶向和晶面垂直;•立方晶系中,晶面族{111}表示正八面体的面;•立方晶系中,晶面族{110}表示正十二面体的面;Symmetryoperators:对称操作1.Rotationaxis(旋转轴)2.Mirror(镜像)3.Inversion(倒置)4.Glideplane(滑动面)5.Screwaxis(螺旋轴)nr:绕轴旋转360°/n,并平行于轴平移一个晶格长度的r/n。什么用呢?不清不对称单位::?由于晶胞中有对称元素,所以不是整个晶胞内对象都是独立的,晶胞中最基本的独立单元叫不对称单位。?不对称单位内的所有对象通过晶胞所具有的对称元素的操作可得到整个晶胞所包含的对象。?一个晶胞可以有多种不同形状的不对称单位,但它们的体积是相等的,等于晶胞体积除以等效点数。unitcell=晶包。Unitcell(晶胞)-->Lattice(晶格)-->Crystal(晶体)不对称晶包/不对称单位:Asymmetricunit:晶包是最小的3D几何图形,它堆积成晶格。不对称晶包是最小的晶体组成部分,可以全部用空间群对称来组成晶体。这不对称晶格可以由部分分子组成,也可以由不止一个分子组成,如果该分子不是对称的话。33MatthewCoefficient(马修系数)::马修发现,晶格体积与晶格分子量的比值在1.7到3.5Å/Da之间,最接近2.15Å/Da。Vm用来表示不对称晶包中的分子数。不对称晶格中有分子的非晶格对称。三维晶胞的原子计数:•在晶胞不同位置的原子由不同数目的晶胞分享:•顶角原子⇒1/8•棱上原子⇒1/4•面上原子⇒1/2•晶胞内部⇒1晶体→单位晶胞→最小体积重复单元:不对称单位BraggEquation(布拉格方程)EwaldConstruction(爱华德构图法):::见PPT39只有矢量构成满足布拉格方程才会发生衍射。无论何时一个倒易晶格点落在爱德华球上时,这种情况都会发生。interference干涉:两个波的叠加叫做干涉。满足2d·sin(θ)=λ·n时增强,2d.sin(θ)=λ.(2n-1)/2时减弱略了一堆看不懂的图7P47-49反射平面相当于倒易晶格点倒易点阵(ReciprocalSpace)及衍射仪设计原理--反射球及晶体的衍射方向(衍射仪的设计原理)见PPT40爱德华球半径是由波长决定的,1/λ。分辨率球半径是由晶体散射限制,1/d(res)只有倒易晶格点与爱德华球相交才会发生衍射。!!!1/λ=n/(2dhklsinθ)我们需要旋转晶体来移动更多的倒晶格点与爱德华球相交。倒易点反应强度Ihkl=|F(hkl)|^2·LP·A成比例。倒易晶格旋转和晶体旋转相同。两个衍射点之间的距离定义了一个晶包。每一个点都是一个正点阵面hklplane的衍射。第三部分衍射数据收集&处理、:::数据收集::数据收集:震动或转动摄像机和检测器,维森博格也是射像的,3,4-循环衍射计。储存在荧光图像板:高灵敏度,更大的检测范围。电子平面检测:更大的检测范围。CCD检测器:更灵敏,可快速读出。同步加速器辐射源。自动化最佳数据收集策略。PPT41无语无奈无结构15\nByJasonWan与上隔绝————多线检测系统--电子平面检测;ADSCQuantum4CCDSystem—CCD;同步辐射是不可缺少的,比普通实验室最好的X光源要亮1亿倍以上;同步辐射:高亮度,起伏能源-高能量可调波长,0.06mm小的不好的晶体都OK,高通量,MAD,脉冲结构。晶体的安装件PPT42\43冷冻结晶:Cryo-crystallography:7P70略掉了,还有缓冲液成分震动设备:使晶体围绕垂直于X射线柱(和测角器)的轴(φ)旋转,一个晶体的衍射图是3d图案,这个晶体必须旋转来观察所有的衍射点。数据处理::检索:找到晶包、方位、空间群。整合/综合:测定每一个点的强度。合并:转换数据,平均数据,确定数据质量。从融合强度计算结构因子振幅。冷冻结晶是得到正确细节结构模型的关键步骤。分辨率和温度,分辨率很重要,低温会使分辨率下降。第四部分结构测定相位测定!见PPT44分析方法的优势:MIR相位测定:选择重原子试剂,有力的计算程序。直接的方法:正在进行。MAD相位:反常散射,Se-蛋白(硒),单个晶体大量数据,直接相位测定。MR相位:NCS,相位改进和延伸,电子密度平均。电子密度图谱的修饰:密度修饰,直方图比对,骨架化,电子密度平均。改进:最小二乘的最小化,约束的限制的改进,模拟退火法。电脑绘图:建模更有效整个都是消耗时间的工作公式一堆,见小纸纸8P51.MIR(MolecularIsomorphousreplacement)多对同晶置换法:附加重原子到晶体的院子上.可以在形成晶体前或后。单对或多对同晶置换法(SIR/MIR):这是目前最常使用的方法,是以测量重原子结合到蛋白质分子上有限的几个特异位点时而导致的衍射强度差(变化)。制备重原子衍生物晶体,一般采用将母体晶体浸在重原子溶液中,常用浓度范围为1mM-10mM,浸泡时间可从数小时到数天,浸泡过程中要必须保证浸泡于重原子溶液中的晶体不出现裂痕。也可尝试用共晶生长法(Co-crystallization)来制备。常用的重金属化合物:略8P7相位问题:重原子浸泡,必须采用同晶型的!!!多种的反应导致结果产生不同的模式,但是都是起源于只能在晶体里的重原子。可以用Pattersonmap来定位重原子的位置。可以通过重原子直接获得相位么?答案是不能!!!当引入了重原子如何获得相位呢?见PPT45.and矢量描述,需要另一个重原子才能获得正确的解决方法。如何得到重原子的FH?Pattersonfunction帕特森函数见小纸第二页。Patterson函数每个峰强度等于原来两个函数之积2.直接方法:傅立叶转换一个结果是自动校正c(r)=f(r)平方。3.MAD:Multiplewavelengthanomalousdiffraction:多波长异常衍射从处于兴奋边缘波长的重原子释放出来的电子频率和自由电子不同。MAD法:对于大的蛋白分子,MAD法要求蛋白质分子中有一个金属原子和波长可调的同步辐射加速器X射线源,结果基本等同于完美的同晶置换法。由于此法依赖于衍射振幅非常小的数值变化,因此必须进行非常准确的测量,在数据收集时必须特别小心。同时或尽量同时(避免晶体损伤造成的误差)在同一张图像上收集数据AnomalousdiffractioncausesthedifferencesbetweenF(h,k,l)andF(-h,-k,-l)异常衍射引起不同。不太懂,略掉了MAD法的结构因子矢量图8P20MAD/SADphasing不服从FriedelRULE(弗里德尔)规则。每一个反应都等于倒易空间的一个点q,还有一个相同强度大小,方向相反的–q。这相反的反应叫原始反应的Friedelmate。得公式|Fhkl|=|F-h–k-l|但是!对MAD和SAD就不遵守这个规则。4.MolecularreplacementMR相位法:分子置换法是使用一个已知的三维结构作为一个粗略模型,计算被观察的未知蛋白质结构的结构因子振幅的起始相角。要求:序列同源性很高(至少为30%同源性,50%以上更好)。改善相位是可以获得更高质量的电子密度图谱。结构测定的工作流程::1.确定相位角:4种方法,不会是上面四种吧……2。计算电子密度(傅立叶叠加)3。电子密度的改善(相位角):局域对称角平均,溶剂平整—晶体50%以上的溶剂应该进行平坦密度。有点像磨滑。无语无奈无结构16\nByJasonWan4.解释电子密度:自动化越来越好。5。结构修正:不同的方法用来改善结构模型使其更符合观察数据,这改善了相位角。不在使用小%级的反射作为修正,人们提出单独的测量来修正结构即RFree剩余值。剩余值要小于25%,但最好大于20%,这取决于分辨率、数据、晶体质量。6。计算一个新的图谱来进一步改善模型。确切的特征只有在相位角进行优化后才能得到看出。这些特征例如:可变区(多构象);水分子(2.0Å分辨率才能和氨基酸一样分辨);不明的结合离子或分子(金属,盐,多肽,缓冲分子);蛋白质修饰。7。重复5,6直到达到目标。】模型的构建:一旦获得了最初的相位,可以获得符合电子密度图谱的模型,如果你思路没错,图谱准确,做的临界实验真实。三维结构模型之建立及修正(Fittingandrefinements):::调试构建模型&实验:计算机绘图程序,相位问题-----缺少原始模型。改善处理:修正::原子模型调节适应测得的衍射数据、标准结晶的剩余值R-factor。•电子密度图的三维构形,可将每一个氨基酸依蛋白质序列建立蛋白质的起始模型。蛋白质的起始模型,常由于相角的解不够完美,使计算出来的电子密度图产生误差,误导模型的走向,因此需要做进一步的改善,称为修正(refinement)。•修正的目的在于进行立体化学(stereochemistry)最佳化(如肽键键长、键角、氨基酸构形)的同时,减少计算与实验绕射点强度的差异,用来评估的数值则是剩余值(R-factor)。一些限制:分辨率,不能解决氢原子位置,不能可靠的分辨氮氧碳,对末端侧链是Asp,GlnandThr原子的化学测定还不明确。•蛋白质结构所能达到的分辨率,主要是取决晶体内分子排列的整齐程度。小分子晶体内并没有太多的水分子,所以常能得到分辨率高于0.5Å的衍射数据。但因蛋白质结构由长的肽链所组成,其间又是由较弱的氢键及范德华力所维持,造成蛋白质结构富有弹性,蛋白质分子与分子的堆栈也就没有那么整齐。同时分子与分子之间的空隙由水分子来填补,也因这些空隙的水分子排列比较紊乱,所以蛋白质晶体衍射出的结果,仅有少数高分辨率晶体,一般蛋白质晶体结构的分辨率约在2.0至3.0Å之间。CCP4软件!!!略!!哈哈!!8P33-41这个是非重点,翻译的也看不懂!!可略!使用ccp4里的Refmac5:1、如果模型有主要部分的重建或改变,改变你模型的残基到你的蛋白中。这时才用到蛋白质的序列.2修正或再次从0TLS参数开始。要确保TLS参数的真实性。如果次要的重建,那么从之前的TLSIN变成TLSOUT3.可以输入固定的TLS值,只进行限制性的修正。修正循环::1.构建电子密度图,从观察到的I和利用模型算出来的Φ。利用所有的hkl数据2.把现在的模型放到数据中3.人工调整模型使其更适合电子密度4.利用电脑程序更进一步的改变模型,使其能更好的预测出观察到的I值(即预测和观察接近)只使用工作hkl数据5.计算R剩余值等,看模型能多好的预测hkl数据的强度。包括工作的和free自由的hkl数据。对电子密度的影响:一般情况,产生cleaner电子密度,经常进行附加次要模型构建,偶尔进行主要模型构建。这两点都是说修饰过程中的改变吧,这些都对电子密度产生影响。产生结果可以在OUTPUT中出现:注意检查R值及剩余量值和TLS的参数,其余略掉8P47最后可以用看图软件查看,略8P48与数据有关的统计:!!!:1、分辨率值域(Å)2、完整度和冗余(%ofhklspots)3、I/σ(Ratioofspottobkg)4RsymorRmerge总剩余值(%)(<10%)5、Rmsdbonds(0.01Å)andangles(1-2º)6.Rworking,Rfree工作剩余值、自由剩余值(~20%)7.Ramachandranplot,拉氏图[指示蛋白质主链二面角允许值范围的图形8.BorTempfactors-areaoccupiedbyanatom.B或温度因子对一个原子占有空间的影响。对数据进行检验和判断:加入水分子和根据化学位置判断各个位置是否合适由于立体化学的限制,一个氨基酸残基的ϕ角和ψ角的任意组合是不允许的。以ϕ角和ψ角作图,称为Ramachandran图。介绍PDB数据库!!!!!proteindatebank第五部分PDB相关::无语无奈无结构17\nByJasonWanPDBfile:hasanunique4accessionnumber,如2AX6。没有氢原子的坐标字符集合:只是一些非控制型字符,象空格和结束符,出现在PDB文件记录中。abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ1234567890`-=[]\;‘,./~!@#$%^&*()_+{}|:“<>?空格和结束符:Unix用一行字符(必须用Writer,word),否则乱码而其他的系统可能就用一个回车来表示。PDB关键之处见PPT4647介绍PYMOL软件::PyMOL=Python+Molecule优点:强大的,可以用命令式或窗口模式操作适用于专业和业余结构生物学研究人员,可以发布质量输出Publishqualityoutput(abuild-inraytracer)是内嵌的射线追踪小工具,交互式的,电影的,越来越流行的,开放软件代码,但不开放二进制的,还在不断发育完善中。不足:文件材料,pymowiki,邮件列表不懂disini~无语无奈无结构18\nByJasonWan本来就没有5……这里的顺序是按照第一课老师给的大纲搞的!!!哈哈哈哈行ahaah!!!无语无奈无结构19\nByJasonWan第六章蛋白质的结构层次大纲:1组成蛋白质一级结构的20种常见氨基酸及其构像2二级结构和超二级结构3三级结构和四级结构蛋白质结构的组织形式:分为四个层次(-级,二级,三级和四级结构)蛋白质一级结构是氨基酸的线性排列;20种常见氨基酸(不知道怎么考)这20氨基酸是基础。分疏水氨基酸(Alanine(丙)AlaA;Valine(缬)ValV;Phenylalanine(苯丙)PheF;Isoleucine(异亮)IleI;Leucine(亮)LeuL;Proline(脯)ProP;Methionine(甲硫)MetM);带电荷的氨基酸(Aspartate(-)(天冬)AspD;Glutamate(-)(谷)GluE;Lysine(+)(赖)LysK;Arginine(+)(精)ArgR);极性氨基酸(Serine(丝)SerS;Threonine(苏)ThrT;Tyrosine(酪)TyrY;Cysteine(半胱)CysC;Asparagine(天冬酰胺)AsnN;Glutamine(谷氨酰胺)GlnQ;Histidine(组)HisH;Tryptophane(色)TrpW)和侧链只有H原子的Glycine(甘)GlyG。甘氨酸残基增加了主干的弹性,因为他没有R基。这些氨基酸不止这么分组,其实互有交叉。氨基酸的聚类分析:LVIM,C;AG,ST,P;RY,WEDNO;KR,H先分空格再分;再分,最后全部分开单个排列。二硫键:2个cysteines(半胱氨酸)可以形成二硫键。是固定二级结构的因子。二硫键(共价的)稳定3-D结构。Ramachandran图(拉氏构像图)::只有面phi(φ)andpsi(ψ)(指化合物的不同平面)的2个面角的值能以确定方式结合,这样才能观察到构象图)这句话是狗屁!金属结合:FeZn基础构件:总结前面:1蛋白质是多肽链2遗传密码规定了20种氨基酸的侧链3半胱氨酸可形成二硫键4肽单元是蛋白质结构的建筑构件5甘氨酸可以适应许多不同的构像6许多蛋白质含固有的金属原子球蛋白有一个紧密的疏水核心。::油水不可混合;把疏水侧链放入内部是主要的折叠动力。难题?:多肽链的主链是高度极性的(亲水的),因为在每一个肽单位有极性的-NHandC=O,这些极性基团一定是被中和了,不然不会有疏水部分。解决方法?:构建有规律的二级结构,例如α-helix,β-sheet,stabilizedbyH-bonds。球蛋白外表面一般是亲水的::二级结构因子形成了疏水核心是很紧密稳定的核心。蛋白质的官能团连接到这一结构(外表),在外表有更多的灵活的结构(loops环)和极性或带电残基。蛋白质表面的疏水补丁(patch)经常参与蛋白质蛋白质互作。蛋白质二级结构::蛋白质二级结构是指多肽链借助氢键排列成自己特有的α螺旋和β折叠股片段(H,E)此外还有β-转角,β-弯曲和无规则卷曲(统称为C或Loop)。α螺旋:蛋白质二级结构中占大部分约30%;平均长度10aas(~15Å):长度从5~40个氨基酸,氢键的排列产生偶极矩(在NH末端有正电荷),经常在核心表层内表面是疏水残基,外表面是亲水的。不同的螺旋:用于替代的螺旋是可能的,就是说还有其他螺旋,例如:3种310–helix(N-H的氢键在位置n,C=O在位置n-3;更大可能性发生接触不良);α螺旋:(N-H的氢键在位置n,C=O在位置n-4);π螺旋(N-H的氢键在位置n,C=O在位置n-5;结构更开放:没有接触;中间的裂缝太小,水都放不下;在拉氏构像图的边缘)在α螺旋中一些氨基酸是优先的,一些是很少存在的:Ala,Glu,Leu,Met有很多;Pro,GlyTyr,Ser非常少;氨基酸的组成和分布变化,是依赖于3D结构中,螺旋的位置。β折叠β-Strands&Sheets::在链上一部分中的5-10个连续的残基与另外一组链更向下链的5-10个连续残基之间形成氢键;互作的区域可以是邻近的(之间形成短环loop)也可以是距离很远的;β折叠经常是不是平行,就是反平行排列。可见9P2324图-折叠片两种形式:平行和反平行式;也有混合型的圈和环CoilsorLoops::用来连接螺旋和片段的,在长度和3D构象上有差异,在结构的表面存在,更能容忍突变,更灵活能够适应多种构象,有倾向有带电或极性氨基酸,经常包含活性位点,一些被分为明显的结构家族(例发卡环转角)蛋白质结构disorder区::Disorderedregions(DRs)无序区是蛋白质缺少固定三级结构的区域;参与多种功能;蛋白质的无序是经常发生的;蛋白质无序程度的描述::0完全有序,1-5部分无序6,7全部无序球蛋白是由循环结构模式构成的::Motifs或超二级结构==二级结构单元的组合Domains是Motifs的组合,是独立的折叠单元,功能单元。无语无奈无结构20\nByJasonWan几个常见的结构图案motif::哈哈翻译成模体1.Helix-turn-helix螺旋转角螺旋(氨基酸序列形成转角)e.g.,DNAbinding;2.Helix-loop-helix螺旋环螺旋((又称EFhand或者Calciumbindingmotif))大手指是F,食指是E,剩下手指成环,包围一个钙。e.g.,Calciumbinding钙结合。它有一定的序列特征,见9P32有一表。3.β-hairpinβ发卡(也叫β-βmotif)由2个反平行β-strand形成,loop长度通常为2-5个氨基酸;频繁出现2adjacentantiparallelstrandsconnectedbyshortloop2个邻近的反向平行链被小环连接4.Greekkey希腊钥匙模体(形状像吧)4adjacentantiparallelstrands4个邻近的反向平行链金黄色葡萄球菌的核酸酶由类似发卡结构到希腊钥匙模体的折叠:折叠链2和3向下折叠,致使β折叠链2被安排在β折叠链的邻侧,而且彼此反平行。图可见9P355.β-α-β2parallelstrandsconnectedbyhelix2个平行链有一个螺旋连接在所给的图中,平行和螺旋连接处是小环,两个环区有不同的功能,深绿色区(小环)常常形成功能结合部位。domain::这些简单的motif模体构成了domain域;大的多肽链可以折叠成若干domain。二级结构和超二级结构总结!!!!:::1.α螺旋有偶极矩2、一些氨基酸优先组成α螺旋3、β折叠有平行和反向平行两种4、环状结构在蛋白质分子表面5、二级结构单元组成了简单的motif(模体)6、Greekkey希腊钥匙模体中是反向平行的β折叠。7、β-α-β模体包含两个平行的β-折叠。8.、简单的motif组成了复杂的motif9、domain=域是由结构motif构成的。10、大的多肽链可以折叠成若干domain。蛋白质结构的6种分类::1)αdomain(由环连接的一束螺旋)2)βdomain主要由反向折叠,经常2个折叠形成一个三明治结构3)α/βdomain(主要平行折叠间隔着螺旋,也有混合折叠)4)α+βdomain(主要有隔离的螺旋和折叠)5)Mulidomain(α&β)多域(包括不止一种的)6)膜和细胞表面蛋白。1)α-domainstructures:coiled-coils(卷曲之卷曲):用螺旋绕麻花多条螺旋通过将疏水侧链放置在一起,在蛋白质中得以稳定;coiled-coils可以使侧链间的相互作用最大化;纤维状蛋白,血影蛋白,肌蛋白,肌球蛋白,一些转录因子。疏水侧链相互作用;有盐桥的帮助(离子作用)Fourhelixbundle:四个螺旋束:疏水残基之间组装很近;连续的螺旋互相抵抗against四个螺旋束的拓扑学:相邻的螺旋反平行的方式,或两对平行的螺旋以反平行的组合方式构成Globinfold(珠蛋白折叠模式)珠蛋白,前面用的都是球蛋白::8个螺旋+小环;有很大的变化(16–99%相似性):螺旋长度,精确位置,Shiftthroughtheridges通过脊的转移大的α结构:细菌胞壁酸酶,450aas,27个螺旋,孔径约3nmβdomain结构::反向平行β结构,功能上有很多种类,包括:Up-and-downsheetsorbarrels上下折叠滚筒状(人血浆中视黄醇(维生素A)结合蛋白)疏水侧链指向内部;上下折叠的这种能形成螺旋桨状结构。Propeller-likestructures螺旋桨状结构(流感病毒神经氨酸酶;不同的折叠一起形成带螺旋桨,活性位点在螺旋桨的中顶部或底部),Jellyrollbarrels(fromGreekkeymotifs)果子冻卷桶-好吃,就是希腊钥匙的桶是叫做Greekkeybarrels组成:这希腊钥匙桶:有2个希腊钥匙motif(γ晶状体蛋白);由上下折叠或希腊钥匙连接形成。希腊钥匙桶可以构成jellyrollbarrels(胶冻卷样的桶)。β螺旋,3个折叠的β螺旋:貌似是说用β折叠组成的螺旋,前面的是2个折叠的。α/β-domainstructures:分3类:1)TIMbarrelTIM桶:相互扭曲的平行(折叠)链的核心靠拢closetogether2)RossmanfoldRossman折叠:开放的扭曲折叠被螺旋在两侧包围Twistedopen-sheet。3)Leucine-richmotif亮氨酸富含的模体:亮氨酸残基的特殊模式,链形成一个螺旋在外部的弯曲折叠片(sheet)、TIM桶:在丙糖磷酸异构酶处理后能形成,一般有8个β折叠,至少200个氨基酸,一般有疏水核心(链里有可交换的氨基酸)。活性位点由桶顶部的(可变)环区构成。domaininsertiondomain插入;基因融合得到两功能的两桶结构(套筒?)这两个都是说桶桶关系~9P62\63Twistedopen-sheetstructures(敞开扭曲的α/β结构域)::螺旋在折叠的两端,活性位点在折叠的连接处,结构多变(自己加的:有一个裂缝见9P64)预测活性位点的位置:当折叠的序列被打断了,经常是一个裂缝,这里经常包含活性位点。Leucinerichmotifscanformα/βhorseshoes(马蹄形折叠模式):保守的亮氨酸对稳定β-环-α结构模件的作用:(自己:螺旋在外侧,折叠中间,亮氨酸疏水在最里面,使得折叠无语无奈无结构21\nByJasonWan发生弯曲)核糖核酸酶抑制剂是这种结构总结!!!!:::1Aminoacids–Chains–Structure–Motifs–Domains2Specificbackboneangles主链角arepermittedornot:Ramachandranplot3Secondarystructureelements:α-helix,β-sheet4Commonstructuralmotifs:Helix-turn-helix,Calciumbinding,β-hairpin,Greekkey,β-α-β5Combinationofelements结构单元andmotifs:tertiarystructure三级结构6Alphadomains:coiledcoil,fourhelixbundle,globinfold环环,4螺旋束,珠蛋白折叠7Betastructures:β-barrels,propeller-likestructures,beta-helixβ桶螺旋桨结构β螺旋8Alpha/betastructures:α/βbarrel,twistedopensheet,horseshoefoldα/β桶,敞开扭曲的折叠,马蹄形折叠无语无奈无结构22\nByJasonWan第七章:蛋白质结构预测与模拟的基本原理提纲:蛋白质结构预测与模拟的历史回顾蛋白质同源模拟介绍总结蛋白质结构可以被理论预测:Gene(DNA)->AminoAcidSeq.->3D-structure蛋白质结构预测:学术价值和经济效益兼备的课题。是结构生物信息学中的主要研究内容区分蛋白质结构预测与蛋白质折叠模拟:蛋白质结构预测:从一级序列预测其三维结构。蛋白质折叠模拟:蛋白质折叠机制的研究。蛋白质一级序列能决定其三级结构。牛逼的诺贝尔奖:1实验证明某些蛋白质在体外的一定条件下解聚失活后可以自动折叠而恢复其原有高级结构与活性,也就意味着蛋白质的氨基酸序列及环境决定其三维构像。2虽然蛋白质在体内折叠研究发现有“分子伴侣”参与折叠过程,但“分子伴侣”可能只起到了稳定中间体的作用,蛋白质高级结构的信息仍全部包含在其一级结构中。3蛋白质一级结构决定高级结构是进行蛋白质结构预测的理论基础。主要的蛋白质三级结构预测能量最小化/从头计算方法FoldRecognition方法同源模拟方法依次需要的结构信息和所得精确度增加能量最小化/从头计算方法预测蛋白质三级结构:原理:天然稳定构像对应自由能最低的构像困难:折叠态与非折叠态能量差很小,要求特别准确的能量项,局部能量最小问题。经典的分子力场能量函数:分子中的原子被认为是由相互间独立的弹簧连接在一起,并且进可能地保持键长和键角的“天然”值。分子的势能采用分析函数的形式表达分子的能量函数通常由三大部分组成:内部能量项、外部能量项和外加限制项。公式略了吧……分子势能函数的各个能量项:见PPT51可以略掉键伸缩能PPT52变态公式键角扭曲能PP553二面角扭曲能:沿着一个给定的键旋转时引起二面角畸变的能量PPT54非键作用项:静电相互作用和范德华相互作用ppt55以上几个要是考,就诅咒他!!!!!!最小化算法::最陡下降法–体系原理最小点时,方法十分有效–在最小点附近,由于梯度接近于零,收敛很慢共轭梯度法–对于起始模型原理平衡点的蛋白质体系,更容易陷入局部势阱牛顿-拉普森法–收敛迅速–由于需要计算和储存大量的二级微商,不适用于大体系改进的牛顿-拉普森法–与牛-拉相比,不需要极大的存储,因此可有效地最小化较大体系一般优化顺序:首先采用最陡下降法,然后采用共轭梯度法和牛-拉法接下来略掉一堆:局部能量最小问题其它不同粗粒化层次的能量函数(特点:小蛋白,高精度能量函数,150CPUdays/protein结果:5/16高精度(<3.0Å)7/16预测不准(>5.0Å)瓶颈:如何寻找全局最小)蛋白质同源结构模拟:目前最可靠的蛋白质结构预测方法!!!原理:蛋白质三维结构比一级结构更为保守。通过找出结构未知蛋白质与结构已知蛋白质的同源性,则可以用结构已知蛋白质为结构模板,预测未知蛋白质的结构。可能最流行的同源模拟程序:Modeller蛋白质结构的弱(远程)同源模拟:依据:研究表明蛋白质序列之间存在很低的序列相似性,但它们仍具有结构相似性。因此,弱同源模拟可拓宽同源模拟的使用范围。第一代方法(又称为Threading和Inversefolding):将待测的氨基酸序列与已知的蛋白质结构进行匹配,找出匹配最好的结构作为结构预测模板第二代方法(又称为FoldRecognition):最显著特点是多信息耦合,特别是对PSI-BLAST的整合。代表着目前蛋白质结构预测最为活跃的一个课题。FoldRecognition流程图:查询蛋白质序列—对FOLDLibrary对折叠库搜索—找到超过可信任的级别(置信级?)confidentlevel的一个折叠—输出Output:最高命中Generatethetophits置信级有多少theconfidentlevelsaresuggested还有校正?AlignmentarealsogeneratedHighlights:强调:Higheridentificationrateforremotehomologues更高的远程同源分辨率Betteraccuracyforthegeneratedalignment更好的对比精度蛋白质结构性质的预测::1总体策略是采用数学方法通过对空间结构已知的蛋白中氨基酸序列与其对应的结构性质进行统计、学习和归纳,无语无奈无结构23\nByJasonWan形成预测规则,用于预测待测蛋白的结构性质2在蛋白质结构预测中扮演着重要的辅助角色3常见的蛋白质结构性质的预测问题:蛋白质二级结构预测;氨基酸溶剂可及性预测;氨基酸接触预测;蛋白质disorder区域预测……蛋白质二级结构预测::二级结构预测可为三级结构预测提供一个好的初始点。蛋白质二级结构预测的主要方法:一Chou-Fasman方法目的:预测每个残基所处二级结构状态(-螺旋,-折叠片层和不规则圈Coil)方法:基于统计学原理二PHD方法三PSIPRED方法蛋白质二级结构预测在蛋白质结构预测中扮演着重要的辅助角色!蛋白质二级结构预测的历史:可略第一代方法(1980以前)–基于单个残基的统计–Chou-Fasman,GORI&II–Q3<60%第二代方法(1986-1992)–基于Segment残基的统计–GORIII–Q3<65%第三代方法(1992-)–多序列比对,进化信息–先进机器学习方法–PHD,PSIPRED等–Q3>70%不同二级结构预测方法的评价略,只有一表氨基酸在蛋白质表面的暴露程度预测:详细预测(残基溶剂可及表面积的绝对值)粗略预测(分为三类:暴露,半暴露和埋在内部,精度可达75%)蛋白质disorder区预测与上一章内容重复:同源模拟的理论及实验基础:通过对类似蛋白质空间结构的比对发现,蛋白质三维结构比一级结构更加保守。氨基酸残基序列有50%相同的蛋白质,约有90%的Calpha原子偏差不超过3Å,均方根偏差约1Å。氨基酸替换通常发生在蛋白质表面回折区域,蛋白质主链结构,特别是疏水核心的结构,受序列变异的影响很小。用结构已知的同源蛋白来预测待定蛋白的结构是可靠的同源模拟的历史(超过20年):了解,最多一选择题1第一例利用已知类似物(同源蛋白)结构预测蛋白质结构的工作是手工完成的2随着计算机图像技术发展,一系列蛋白质同源模拟软件相继被开发3高度自动化4从单个蛋白到对整个基因组蛋白的模拟5可分为3类:–商业软件,虽然有些也同时提供学术License,但界面较差,对使用要求较高–在线服务器–通过发送Email同源建模流程:按照目的序列对已知结构模板进行选择,对目的序列和模板进行比对,得到结构模型,对结构进行评估,不行就在进行选择模板操作,OK就得到了同源模拟模型。三个瓶颈:获得结构模板;比对的精确度;loopmodeling环建模??啥意思……囧懂了是非保守区的意思具体流程:::模板的选取及比对的获得::予处理:–确定结构域的界限–判断是否多聚体–可能的功能了解同源性搜索(PDB或蛋白质结构分类数据库):–SequenceIdentity–E-value比对的获得:–动态规划法–更好的比对方法(例如T-Coffee)–如有必要,手动调整结构模拟(一)主链结构预测:主链结构预测–根据比对结果,将已知结构中的片断拷贝到未知结构中去3501/06/2010CAU-CBS/BioInformatics-ZhangZ中国农业大学生物学院(二)非保守区(loop区)主链结构预测:–数据库查询办法(经常采用)–系统构象搜索办法(要求更多计算量)–对于较长氨基酸片段的loop,很难保证模拟的结果是可靠的(三)侧链结构预测:主要原则是借鉴结构已经测定蛋白的侧链构象,或从能量角度和空间位阻角度出发预测目标蛋白中残基的侧链构象。目前侧链构象预测方法主要利用构象库(rotamers)的概念。侧链安装程序SCWRL模型优化及后处理:同源预测得到的蛋白质结构模型,通常含有较多不合理的原子间接触,因而必须进行能量优化优化常用方法为分子力学优化和分子动力学模拟一般采取限制型优化方法,即先约束体系中的所有重原子,优化氢原子;接下来可以约束主链原子,优化侧链原子;最后放开约束,优化整个体系。模型的评估::无语无奈无结构24\nByJasonWan立体化学性质检测:–PROCHECK–Profile-3D–检测结果不好,模型肯定错误–但是检测结果好,模型不一定正确常用同源模拟网上资源介绍:Modeller;Swiss-Model;3D-JIGSAW;EsyPred;CPHmodels;SDSC1Swiss-Model进行介绍!见12P434445看不出来哪里介绍了……4601/06/2010CAU-CBS/BioInformatics-ZhangZ中国农业大学生物学院同源模拟研究展望:–Loop区模拟已相当成熟–本质还是模板不够多三个瓶颈:近年来进展不多,但应用进一步扩大–模板的选择在功能基因组研究中可能发挥着越来越重要的作用–比对的准确性如何将结构与功能建立联系将是更重要的任务接下来举例子:肥胖病的药物靶标:11βHSD1。讲了胖胖比较危险,这个蛋白作用很多,得到3D模型了,然后用PROCHECK进行模型质量的检测,PROCHECK是评估所给蛋白的立体化学质量,并不是模型正确性的标准。将晶体结构和所得模型进行比较。很成功,可以把模型用来筛选新的抑制子(因这个蛋白也是抑制肥胖的蛋白)。蛋白质结构预测方法的比较:鬼知道什么意思,记得有鼓励的意味……略Realtimecomparison实时比较:LiveBenchEVAOlympicgameofproteinstructureprediction5201/06/2010CAU-CBS/BioInformatics-ZhangZ中国农业大学生物学院总结蛋白质结构预测流程图1氨基酸序列2予处理3优先性由高到低3.1同源模拟3.2弱同源模拟3.3从头计算法和二级结构预测4模型精修及评估5应用需要的基础:蛋白质结构数据库蛋白质序列比对和结构比对达尔文拯救薛定谔!就是说进化的同源可以模拟出结构模型,薛定谔是搞结构的,所以这么说……蛋白质通过其特定的三维结构行使其生物学功能蛋白质结构预测的两个重要应用:一基于编码蛋白结构的基因功能注释二基于结构的药物设计下一篇就是编外的内容药物设计!!!!无语无奈无结构25\nByJasonWan编外:计算机辅助药物设计概论1.CADD的简介2.CADD的特点3.CADD的方法1.CADD的简介计算机辅助药物设计(computer-aideddrugdesign)是以计算机化学为基础,通过计算机的模拟、计算,预测药物与受体生物大分子之间的关系,设计和优化先导化合物的方法。2.CADD的特点:传统药物设计方法:•耗时•耗劳力•成本高•以分子为主•单一计算机辅助药物设计方法:•快速•有效•经济•以模型为主•多元创制新药的概率:每过一步变小,还要10-12年大约2%成功药物发现过程耗时耗力。10,000-10,000,000当中找1个。药物研究是一个多学科交叉的系统工程。废话……药物研究的核心科学问题见PPT48哈~包括1先导结构发现的高效性2作用靶标的特异性3先导结构与靶标的选择性现代药物研究的核心技术:?有机合成技术:组合合成、不对称合成?计算机技术:分子模拟、虚拟筛选?分子生物学技术:PCR、高通量筛选、高内涵筛选?化学生物信息学技术:基因组学、蛋白质组学、化学基因组学计算药物设计的几种情形:1靶标三维结构已知(依照结构进行药物设计)2靶标三维结构未知(已知结构作为模板,用同源性模型——序列比对、结构最优化、MD模拟——获得靶蛋白的3D模型(建一个锁,然后找到钥匙)。再基于配基的分子设计(根据检查钥匙来推测锁的样子)计算药物设计的起点:即根据条件:起始复合物目标结构选择不同策略Leadcompound(s)TargetstructureStrategyyesnoLigand-basednoyesStructure-basedyesyesIntegratedapproachnonoNoprogram!3.CADD的方法:?基于结构的药物设计?基于作用机理的药物设计基于结构的药物设计:?间接药物设计:基于药物小分子结构。?定量构效关系?药效团模型方法?直接药物设计:基于生物大分子结构。?分子对接?从头设计方法定量构效关系:QSARQuantitativestructure-activityrelationships分为2D和3D的2D-QSAR:借助化合物的理化参数或结构参数,用数学的模式描述有机小分子(如底物、抑制剂、激动剂、拮抗剂)与有机大分子(如酶、受体、细胞、组织、动物、人等)间相互作用的情况。用数学方程表示有机化合物与生物活性的关系:生物活性=f(物化参数或结构参数)活性定量化合适的数学模型结构参数化构建了几种模型略可见PPT49不仅需要2D更要三维的哈~见PPT503D-QSAR----CoMFAandCoMSIA完全不懂~略~药效团模型方法::药效团的含义?含义:一系列药物分子与同一受体结合(或作用)时,起重要作用且可与受体结合位点形成氢键、静电相互作用、范德华相互作用、或疏水相互作用的原子或官能团,称药效团(pharmacophore)。?若加上这些原子或基团的空间距离限制,就称为三维药效团(3D-pharmacophore)。?作用:在受体三维结构未知时,药物分子的三维药效团用于:1.比较活性分子和无活性分子的构象和体积,发现差异;进行先导优化。2.推测受体与药物结合的“空腔”结构信息;进行新的先导化合物的设计。药效特征元素:①氢键受体:带有孤对电子的N、O、F、S比如:C=S,C=N,C=O②氢键给体:与氢原子连接的N、O比如:-OH,-NH2,-NH-③疏水中心:疏水基团一般由非极性的原子构成,只要不和带电原子或电负性中心相连的一组连续的碳原子都可以构成疏水中心。比如:甲基、乙基、苯环等基于结构的药物设计::?间接药物设计:基于药物小分子结构。?定量构效关系?药效团模型方法?直接药物设计:基于生物大分子结构。?分子对接?从头设计方法直接药物设计:根据受体靶标的结构,设计能与其结合的小分子化合物,又称生物合理设计方法。无语无奈无结构26\nByJasonWan一、分子对接:分子对接方法在药物设计中取得巨大的成功,已经成为基于结构药物设计的最重要的方法之一。分子对接的最初思想起源于FisherE提出的“锁和钥匙模型”。即受体与配体的相互识别首要条件是空间结构的匹配。分子对接中的重要问题:•如何找到最佳的结合位置(构象优化问题);•如何评价对接分子之间的结合强度。(打分函数问题)分子对接的基本方法:•刚性对接方法•柔性对接方法•半柔性对接方法评价:打分函数:每一个对接的算术都会采用平衡了时效和精确度的简单自由能预测方法。现在的打分函数主要包括三种:基于经验的回归参数的方法;基于分子力场的方法和基于知识的方法。基于分子对接方法虚拟筛选的具体流程略掉了,见11P6接下来打印PDF11的7-12页:以下内容重复。无时间可不看打印PDF只省略了例子所有CDKs的小分子抑制剂共同的特点:(1)一般分子量小(<600);(2)平面、疏水性的多环化合物;(3)主要通过和ATP竞争来占据酶的ATP结合口袋;(4)主要通过疏水和氢键作用与酶结合;(5)配体与CDK2作用时,一般与Leu83和Glu81形成氢键。结语:?分子对接方法应用非常广泛?是目前最为成功的药物设计方法?分子对接发展的一些新趋势:?利用结合自由能作为评价函数?考虑大分子的柔性?与组合化学相结合二、全新药物设计?全新药物设计(denovodrugdesign),又称从头设计。就是根据靶标分子结合位点的几何特征和化学性质,设计出与其形状、性质相匹配(静电、空间的互补,实际应用中一般只考虑疏水作用和氢键作用)的全新化学结构。步骤:1.确定活性位点根据靶标三维结构以及受体-配体的作用特征,合理定义受体活性结合位点的结构和化学特征,如疏水场分布、氢键作用位点、静电场分布、立体结构等;这些特征除了从受体的结构或生化实验中得到,也可以用一些计算方法得到如CoMFA模型、药效基团模型、分子对接模型等。2.产生合适的配体分子根据活性位点的特征,产生相应的相匹配的配体小分子片段,通过分子连接法或碎片连接法将小分子片段连接成完整的配体分子。3.配体分子活性的评估对连接完整的配体分子,通过一定的方法来评价它们与靶标分子的结合活性,并且进行排序,从中选择部分评价最佳的配体分子进行一步的结构优化或合成。4.配体分子的合成和活性测试选择评价最佳的配体分子进行合成,并且测定其活性,经过几轮循环,发现新的先导化合物。(二)全新药物设计的方法:通过分析蛋白质活性口袋的特征来得到和口袋特征相匹配的配体分子或片段。?碎片连接法?碎片生长法碎片连接法:优点:?碎片与受体活性部位的结合方式可以用多种方法得到;?碎片间的连接方式有多种选择;?设计化合物的刚性较大,避免了药物与受体结合时熵的损失;?可以设计柔性骨架,并考虑碎片和骨架的柔性构象变化缺点:?如果考虑碎片和骨架的柔性,则数据库搜寻花费的时间太长;?如不小心,所设计的骨架会与受体有不合理的碰撞,所以必要时要进行能量优化,这也会降低数据库搜寻的速度;?如不进行人工干预,碎片连接法设计的分子可能比较复杂,药物化学家难以合成。碎片生长法:如果以不同的孤立片段做为起点,可以得到不同的配体分子,这种方法在生长的过程中,新加入的片段一般会进行构象分析来确定最佳构象,这样很大程度上可以避免漏筛。同时,考虑了分子的柔性,就要考虑速度和完备性之间的平衡。局限性:a.)怎样让分子的生长能跨越活性口袋中那些对配体贡献不大的结合区域;b.)怎么避免组合膨胀问题。因为在一个片段的基础上,片段生长有很多种方式,以次类推,生长多次后,生产的分子数是很大的;c.)生成的分子,很大一部分无法合成。d.)往往忽略分子片段内部的柔性。无语无奈无结构27