<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="zh-Hans-CN">
	<id>https://osm.bio/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Shiningstars</id>
	<title>osm&amp;bio - 用户贡献 [zh-cn]</title>
	<link rel="self" type="application/atom+xml" href="https://osm.bio/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Shiningstars"/>
	<link rel="alternate" type="text/html" href="https://osm.bio/%E7%89%B9%E6%AE%8A:%E7%94%A8%E6%88%B7%E8%B4%A1%E7%8C%AE/Shiningstars"/>
	<updated>2026-04-07T03:47:13Z</updated>
	<subtitle>用户贡献</subtitle>
	<generator>MediaWiki 1.45.1</generator>
	<entry>
		<id>https://osm.bio/index.php?title=%E9%82%A3%E4%BA%9B%E4%BD%A0%E6%9C%80%E6%83%B3%E5%81%9A%E7%9A%84%E4%BA%8B&amp;diff=7349</id>
		<title>那些你最想做的事</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E9%82%A3%E4%BA%9B%E4%BD%A0%E6%9C%80%E6%83%B3%E5%81%9A%E7%9A%84%E4%BA%8B&amp;diff=7349"/>
		<updated>2025-05-10T15:06:33Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;请写下那些你最想做的事&lt;br /&gt;
&lt;br /&gt;
*考完联赛后疯玩两天！顺便整理一下家里的收藏。——C.C.&lt;br /&gt;
*考完联赛我要把所有之前想填的坑都填辣！——MangoCat&lt;br /&gt;
*睡觉，这是人生最重要的事（真的时间是最长的）。——🍬&lt;br /&gt;
*考完联赛，如果有机会，我想要把命题ai给做出来，爆杀所有的机构模拟卷。——luphut&lt;br /&gt;
*考完联赛去打一场痛快的球（联赛前怕脚崴不方便，好久没打了）——2610115639&lt;br /&gt;
*考完联赛，想找一个空闲的时间，带着新的笔记本电脑，到市里的图书馆自习一天生物。——卡共和&lt;br /&gt;
*考完联赛和喜欢的人一起发呆一个下午，然后睡觉zzzzzzzzz，还要在西安到处玩，想去南湖 ——单位捕捞努力的🐟&lt;br /&gt;
*爽玩到周二返校，狠狠地发癫填坑，收拾一下好久没回没整理的自己的房间，开心当雪豹——Gardenia Ai&lt;br /&gt;
*联赛完爽玩1999，然后和他狠狠亲！！！！然后学日语然后学贝斯然后学化学然后学吉他啊啊啊啊——HuGo&lt;br /&gt;
*联赛完其实想爽唱一晚KTV但可惜没有人陪T_T——竹下。&lt;br /&gt;
*被聚合酶佬薄纱……molmolmol----ヽ(*≧ω≦)ﾉ(｡･ω･｡)ʕ￫ᴥ￩ʔ(∗•ω•∗)ᕦ(ò_óˇ)ᕤ&lt;br /&gt;
*进国集，拿着金牌找她一起去秋叶原，一起看烟花——鹭&lt;br /&gt;
*拿省一，吃一口学妹和某神秘人的安利去把《魔戒》看了，画个手书，也许爽睡一天？——垂直&lt;br /&gt;
*我也想去KTV有没有安徽的群u（悲）————沿阶草&lt;br /&gt;
*考完联赛爽玩边狱巴士！请务必让我抽到默笠花（泣（我是绝望的锁哥单推人呃呃呃）以及画锁的手书；如果进了省队爽玩之后就是买动植物的解剖图册还有做实验😋！——W. Machine&lt;br /&gt;
*考完联赛，听一整天术曲，然后把之前留了一半没写完的小说补个结尾。还有楼上的，剑默现在应该抽不到罢毕竟是活动人格。——聿&lt;br /&gt;
**回：我去我记成赛季人格了dbq😭（换不起那很绝望了（）——W. Machine&lt;br /&gt;
*考完联赛听着夜鹿画一天画打一天第五！————乙年&lt;br /&gt;
*我要立刻写鸟书——火鸟&lt;br /&gt;
*高一半年进队，给各位来点极速震撼，然后痛痛快快的在女孩子怀里哭一场——煮风&lt;br /&gt;
*离考试没有几个小时了，或许明年就要退竞了，但要在忘记之前把记住的都留在这个网站——Shiningstars&lt;br /&gt;
*&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%A8%E6%88%B7:Shiningstars&amp;diff=7122</id>
		<title>用户:Shiningstars</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%A8%E6%88%B7:Shiningstars&amp;diff=7122"/>
		<updated>2025-05-08T14:41:10Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;qq2791436702&lt;br /&gt;
可以在互联网大海发现这个网站是幸福的事！&lt;br /&gt;
对不起各位我真的是彩笔&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
试着面向对生物竞赛有幻想的同学作简单介绍，尤其是对竞赛没什么概念的同学&lt;br /&gt;
&lt;br /&gt;
由于作者水平恐怕也就是入门多一点，更深的内容如果错漏还望指正。&lt;br /&gt;
&lt;br /&gt;
=== 一，为什么学生物竞赛？ ===&lt;br /&gt;
笔者无法解释自己为什么选择生物竞赛，一开始只是想在初三多学点高中内容，不知道为什么就成了竞赛爷，马上要成为反面例子。&lt;br /&gt;
&lt;br /&gt;
如果你也有这种心理，请一定要好好思考为什么要学习生物，如果自己完全没有内驱力，或者只者想在竞赛室给手机充电&lt;br /&gt;
&lt;br /&gt;
等到假期不放，教练不管，不能比上大佬一根毛，停课以来一直鬼混（本人），你就知道好了。面对列队走来的几十本厚书，这点内驱力完全不够，很快就开始划水。&lt;br /&gt;
&lt;br /&gt;
一定要有一个足够强大的理由支撑你把生物竞赛学下去，比如说热爱，比如说完成梦想，总之是让你做很多重复工作也不会使你特别困倦的。&lt;br /&gt;
&lt;br /&gt;
=== 二，应该拥有什么特质？ ===&lt;br /&gt;
我们可以对着基督教的七宗罪来写：&lt;br /&gt;
&lt;br /&gt;
* &#039;&#039;&#039;暴食&#039;&#039;&#039;：稍微扩展成注意身体吧，比如说，你以现在的作息狠狠卷，进集以后还能活几年？我们学校的巨佬经常性突然想吐，长时间熬夜，我不希望任何人这样做。&lt;br /&gt;
* &#039;&#039;&#039;贪婪&#039;&#039;&#039;：拥有和常人一样的娱乐时间是不切实际的，你比常人学了多得多的东西，不可能和正常人用同样的时间消化。（除非你巨）在单休制度下，不要报复性熬夜娱乐。&lt;br /&gt;
* &#039;&#039;&#039;强欲&#039;&#039;&#039;：不要逼自己和别人一样巨，不要觉得自己一定能获得好结果（比如清北复交浙）和巨佬能保持差距不大且恒定就很厉害了，能在这种否定下把生物按部就班地学下去就很厉害了。或许你在生物的天赋并不如别人高，但是你总有一些别人做不到的事情，而日后生物方面的学习一定能在你生命的某瞬间帮到你，提醒你即使没有获得想像中的美好结局，也有独一无二的收获。绕远路才是我最短的捷径！&lt;br /&gt;
* &#039;&#039;&#039;色孽&#039;&#039;&#039;：哥们没有女朋友，跳了&lt;br /&gt;
* &#039;&#039;&#039;嫉妒&#039;&#039;&#039;：有的人他生来就比你强，再努力也永远赶不上，如果一定要和他保持统一步调只会把自己逼死。不建议搞人，首先是容易败露，其次是搞掉一个巨佬对你自己的排名帮助不大。&lt;br /&gt;
* 懈怠：我现在就在。&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E5%85%B1%E5%90%8C%E5%87%BA%E9%A2%98%EF%BC%88%E6%97%A8%E5%9C%A8%E6%94%B6%E9%9B%86%E5%B9%B3%E6%97%B6%E6%95%A3%E5%87%BA%E7%9A%84%E9%A2%98%EF%BC%8C%E4%BD%A0%E8%A6%81%E6%98%AF%E5%96%9C%E6%AC%A2%E4%B9%9F%E5%8F%AF%E4%BB%A5%E6%B3%A1%E5%9C%A8%E8%BF%99%E9%87%8C%E5%87%BA%E9%A2%98%EF%BC%89&amp;diff=7048</id>
		<title>共同出题（旨在收集平时散出的题，你要是喜欢也可以泡在这里出题）</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E5%85%B1%E5%90%8C%E5%87%BA%E9%A2%98%EF%BC%88%E6%97%A8%E5%9C%A8%E6%94%B6%E9%9B%86%E5%B9%B3%E6%97%B6%E6%95%A3%E5%87%BA%E7%9A%84%E9%A2%98%EF%BC%8C%E4%BD%A0%E8%A6%81%E6%98%AF%E5%96%9C%E6%AC%A2%E4%B9%9F%E5%8F%AF%E4%BB%A5%E6%B3%A1%E5%9C%A8%E8%BF%99%E9%87%8C%E5%87%BA%E9%A2%98%EF%BC%89&amp;diff=7048"/>
		<updated>2025-05-08T00:41:29Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* 较难题 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;==题目==&lt;br /&gt;
一些话：以新联赛不定项方式（四个选项，判断正误）的形式出题。难度不用超过考试太多，模仿到联赛或国赛出题风格，节奏与难度的题目最佳。减少过于困难的题目，如果本身是追求难度、创意或者偏的知识点，可以在每学科&#039;&#039;&#039;【较难题】&#039;&#039;&#039;中出题。&lt;br /&gt;
&lt;br /&gt;
希望达到这样一种境界：看到书发现好的点时，就来出一题&lt;br /&gt;
&lt;br /&gt;
===梗百科/生竞常识===&lt;br /&gt;
&lt;br /&gt;
# 关于主流教材，你觉得正确的是：&lt;br /&gt;
#* A. 细胞生物学第五版的主编是翟中和院士&lt;br /&gt;
#* B. 普通动物学的版次在00年代&lt;br /&gt;
#* C. 植物学最严谨的教材是马炜梁&lt;br /&gt;
#* D. 生理学最新版的作者是朱大年&lt;br /&gt;
# 关于生物竞赛，你觉得正确的是：&lt;br /&gt;
#* A. 省一一般对于升学有较大优势&lt;br /&gt;
#* B. 生物竞赛是以高中生物学为基础，本科教材为拓展进行命题&lt;br /&gt;
#* C. 每年联赛评议完题目，争议题都会删除&lt;br /&gt;
#* D. 又名背书竞赛，完全不需要理解&lt;br /&gt;
# 关于生物竞赛教师或机构，你觉得正确的是：&lt;br /&gt;
#* A. 朱斌曾在质心任职，现在在猿辅导&lt;br /&gt;
#* B. 喵健曾在质心任职，现在在北斗学友&lt;br /&gt;
#* C. 北斗学友其实是一只青蛙&lt;br /&gt;
#* D. 汇智其实是四字机构，金石也是四字机构&lt;br /&gt;
# 关于下列说法，你认为正确的是：&lt;br /&gt;
#* A. 杨sir是南京大学教授，讲授生物系和医学部的生物化学，已退休&lt;br /&gt;
#* B. 周德庆是微生物学教程主编，目前已主编至第四版&lt;br /&gt;
#* C. 最新版王镜岩生物化学又称“大生化”，主编是王镜岩和朱圣庚&lt;br /&gt;
#* D. 刘祖洞遗传学是复旦系教材，而戴灼华遗传学是北大系教材&lt;br /&gt;
#根据生物竞赛的不定项得分规则，如果你在考试时碰到了一道不会的题，下列说法正确的是：&lt;br /&gt;
#* A. 如果该题只有一个选项为T，则选择FFFF比选择TFFF得分的数学期望高&lt;br /&gt;
#* B. 如果该题只有两个选项为T，则任意选择两个T两个F，得分的数学期望为13/30&lt;br /&gt;
#* C. 不可能出现选项为FFFF的情况&lt;br /&gt;
#* D. 如果该题只有三个选项为T，则任意选择三个T一个F，得分的方差为0.12&lt;br /&gt;
&lt;br /&gt;
===细胞生物学===&lt;br /&gt;
====基础====&lt;br /&gt;
&lt;br /&gt;
# 多细胞有机体的三种识别系统是：&lt;br /&gt;
#* A. 抗原-抗体&lt;br /&gt;
#* B. 酶和底物&lt;br /&gt;
#* C. 配体-受体&lt;br /&gt;
#* D. 细胞-细胞（mt）&lt;br /&gt;
&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
# 关于整联蛋白，你认为正确的有：&lt;br /&gt;
#* A. 是穿膜的异质二聚体&lt;br /&gt;
#* B. α 要和 RGD 识别，然后和纤连蛋白结合&lt;br /&gt;
#* C. β 头部的硫元素比较多，但是 α 大小两部的交界处则几乎没有&lt;br /&gt;
#* D. β 受体与 RGD 识别后，通过黏着斑蛋白与肌动蛋白结合（mt）&lt;br /&gt;
&lt;br /&gt;
===生物化学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
# 下列有关于糖类的说法正确的是：&lt;br /&gt;
#* A.对于D-葡萄糖来说，椅式构象比船式构象更稳定。&lt;br /&gt;
#* B.实际应用中，常用苯肼的成脎反应区分D-葡萄糖和D-果糖。&lt;br /&gt;
#* C.热的稀硝酸是强氧化剂，可将D-半乳糖氧化为D-半乳糖二酸。&lt;br /&gt;
#* D.单糖环化后形成半缩醛/半缩酮羟基，会失去其还原性。&lt;br /&gt;
# 黄天在上，我与赌毒不共戴天！请问下列反应生成黄色物质的有：&lt;br /&gt;
#* A.己糖+间苯三酚/浓盐酸&lt;br /&gt;
#* B.茚三酮+Pro&lt;br /&gt;
#* C.Tyr+浓硫酸+浓盐酸&lt;br /&gt;
#* D.戊糖+甲基间苯二酚/浓盐酸&lt;br /&gt;
# 下列关于糖代谢的说法正确的是：&lt;br /&gt;
#* A.碘代乙酸和氟化物可以破坏GAPDH活性中心的巯基，从而抑制糖酵解。&lt;br /&gt;
#* B.砷酸可以与还原性的硫辛酰胺形成共价复合物，同时抑制丙酮酸脱氢和三羧酸循环。&lt;br /&gt;
#* C.UDP-D-半乳糖-4-差向异构酶需要NAD+作为辅酶。&lt;br /&gt;
#* D.F-2,6-BP是丙酮酸激酶的别构激活剂，介导一种前馈作用。&lt;br /&gt;
&lt;br /&gt;
===分子生物学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===植物学===&lt;br /&gt;
====基础====&lt;br /&gt;
&lt;br /&gt;
# 关于植物的营养器官，你认为正确的是：&lt;br /&gt;
#* A. 初生结构里韧皮部是外始式的&lt;br /&gt;
#* B. 通常维管束中自外而内看，先出现梯纹或网纹导管，然后是环纹或螺纹导管&lt;br /&gt;
#* C. 仙人掌刺和皂荚刺同源&lt;br /&gt;
#* D. 横切一个枝叶茂盛的细茎植物，会出现维管横断，切向切可见纤维样的维管射线（mt）&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
===植物生理学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===微生物学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===动物学===&lt;br /&gt;
====基础====&lt;br /&gt;
1.A.在海边捡到一枚软骨脑匣，可确定它的拥有者有角质齿&lt;br /&gt;
&lt;br /&gt;
B.切断直接连接田螺两侧神经节的神经索，对其外套膜生理功能产生影响&lt;br /&gt;
&lt;br /&gt;
C.一颗石子深入蚌的内脏团中，并不会长出珍珠&lt;br /&gt;
&lt;br /&gt;
D.田螺的右侧很强大，其腹脏神经索前段位于食道上部，而雄性右侧触角特化为交接器&lt;br /&gt;
&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
* 1，判断下列关于无脊椎动物的说法正误 &lt;br /&gt;
* A.偕老同穴属于寻常海绵纲，复沟型，鞭毛室大&lt;br /&gt;
* B.人如果误食猪带绦虫由孕卵节片产生的虫卵会导致猪带绦虫极易附于小肠黏膜  &lt;br /&gt;
* C.海盘车真体腔发达，体腔液中含两种变形细胞，有吞噬作用  &lt;br /&gt;
* D.毛颚动物的体腔为次生体腔，雌雄异体，无循环系统和排泄系统&lt;br /&gt;
* 2，下列有关于六足亚门变态发育正确的是：&lt;br /&gt;
** A.蝉蛹，每个人都爱吃，但你真的了解蝉蛹吗？蝉是一种完全变态的昆虫，因此有蝉蛹之说。&lt;br /&gt;
** B.表变态为内颚纲昆虫特有，胚后发育仅为个体增大，性器官渐成熟。&lt;br /&gt;
** C.大部分同翅目属于渐变态，但粉虱科和雌性蚧壳虫为特殊的过渐变态类型。&lt;br /&gt;
** D.复变态在某些幼虫营寄生生活的昆虫中具有，如捻翅目。&lt;br /&gt;
&lt;br /&gt;
===生理学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
# 下列有关肺通气的说法正确的是：&lt;br /&gt;
#* A.根据物理学原理，气体流动需要压力梯度的存在，故肺泡气与外界大气之间的压力差是实现肺通气的原动力&lt;br /&gt;
#* B.腔静脉和胸导管位于胸膜腔内，而气胸会导致胸膜腔内压减小或消失，进而引起血液和淋巴回流受阻&lt;br /&gt;
#* C.肺弹性阻力可以用肺顺应性来表示，后者等于肺容积变化除以肺内压变化&lt;br /&gt;
#* D.一般情况下，青壮年男性和运动员以腹式呼吸为主&lt;br /&gt;
&lt;br /&gt;
===生态学和行为学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===遗传学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===演化生物学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===生物信息学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===生物技术===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===综合题/文献题===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
==&#039;&#039;&#039;答案与解析（以及对题目本身的讨论和勘误）&#039;&#039;&#039;==&lt;br /&gt;
===梗百科/生竞常识===&lt;br /&gt;
&lt;br /&gt;
# &#039;&#039;&#039;FTFF&#039;&#039;&#039;&lt;br /&gt;
# &#039;&#039;&#039;FTFF&#039;&#039;&#039;，关于 C，其实还有答案更改&lt;br /&gt;
# &#039;&#039;&#039;TTFT&#039;&#039;&#039;，关于 C，在 2025BAT1 的第 33 题中，明确写着那个东西是爬行动物（原作是鳄鱼），而青蛙是两栖动物（他人注:我总觉得这画的是鳄鱼 orz）（他人注：vx 表情包搜索“抹茶旦旦”，你会找到“我是小鳄鱼谢谢”之类描述，尊重原作吧，yysy 画得很抽象）（本人注：所以 C 选项是 F ，不是青蛙）&lt;br /&gt;
# &#039;&#039;&#039;TTFT&#039;&#039;&#039;&lt;br /&gt;
# &#039;&#039;&#039;TTFT&#039;&#039;&#039;  A.选择TFFF得分数学期望为(2+0.2+0.2+0.2)/4＝0.65，选择FFFF得分数学期望为1(单选题不会做，4个F走起) . B.六种情况，用E(X)的公式计算即可. D.方差公式D(X)＝E(X²)-E²（X），据此计算。本题考查随机变量的均值和方差，属于基础题[[文件:屏幕截图 19-3-2025 213155 .jpg|缩略图|BAT1的第33题]]&lt;br /&gt;
&lt;br /&gt;
===细胞生物学===&lt;br /&gt;
&lt;br /&gt;
==== 基础 ====&lt;br /&gt;
&lt;br /&gt;
# 多细胞有机体的三种识别系统是：&lt;br /&gt;
#* A. 抗原-抗体&lt;br /&gt;
#* B. 酶和底物&lt;br /&gt;
#* C. 配体-受体&lt;br /&gt;
#* D. 细胞-细胞（mt）&lt;br /&gt;
&#039;&#039;&#039;TTFT&#039;&#039;&#039;，记忆题。笔者认为，自己编的C选项配体-受体应该也算&#039;&#039;广义的酶-受体&#039;&#039;或者&#039;&#039;细胞-细胞的一环&#039;&#039;。题目中这三种是：免疫反应 催化反应和信号传递。&lt;br /&gt;
&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
# 关于整联蛋白，你认为正确的有：&lt;br /&gt;
#* A. 是穿膜的异质二聚体&lt;br /&gt;
#* B. α 要和 RGD 识别，然后和纤连蛋白结合&lt;br /&gt;
#* C. β 头部的硫元素比较多，但是 α 大小两部的交界处则几乎没有&lt;br /&gt;
#* D. β 受体与 RGD 识别后，通过黏着斑蛋白与肌动蛋白结合（mt）&lt;br /&gt;
&lt;br /&gt;
# &#039;&#039;&#039;TFFF&#039;&#039;&#039;，A. 基础识记；B. αβ 反了，这里是 β；C.α大小两部要通过双硫键相连；D. β 先和裸蛋白结合，然后和肌动蛋白结合。（这部分比较乱，参见王金发细胞生物学 P112-P113）&lt;br /&gt;
&lt;br /&gt;
===生物化学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
*下列有关于糖类的说法正确的是：&lt;br /&gt;
** A.对于D-葡萄糖来说，椅式构象比船式构象更稳定。&lt;br /&gt;
** B.实际应用中，常用苯肼的成脎反应区分D-葡萄糖和D-果糖。&lt;br /&gt;
** C.热的稀硝酸是强氧化剂，可将D-半乳糖氧化为D-半乳糖二酸。&lt;br /&gt;
** D.单糖环化后形成半缩醛/半缩酮羟基，会失去其还原性。&lt;br /&gt;
* &#039;&#039;&#039;TFFF&#039;&#039;&#039;，A选项确实是对的，杨sir上有讲；B选项是杨sir小quiz的原题，由于苯肼与单糖在1、2号位反应，而D-葡萄糖、D-果糖、D-半乳糖的1、2号位是完全相同的，所以并不能区分；C选项，如果你闲来无事仔细观察一下半乳糖的分子结构式，你会发现它被氧化为糖二酸后会发生内消旋，失去手性，这点在王镜岩上有讲；D选项比较明显。&lt;br /&gt;
* 黄天在上，我与赌毒不共戴天！请问下列反应生成黄色物质的有：&lt;br /&gt;
** A.己糖+间苯三酚/浓盐酸&lt;br /&gt;
** B.茚三酮+Pro&lt;br /&gt;
** C.Tyr+浓硫酸+浓盐酸&lt;br /&gt;
** D.戊糖+甲基间苯二酚/浓盐酸&lt;br /&gt;
* &#039;&#039;&#039;TTTF&#039;&#039;&#039;，A选项间苯三酚反应，戊糖与间苯三酚/浓盐酸反应生成朱红色物质，其他单糖与间苯三酚/浓盐酸生成黄色物质。B过于经典。C的名字就叫黄色反应。D选项应为蓝绿色物质。&lt;br /&gt;
* 下列关于糖代谢的说法正确的是：&lt;br /&gt;
** A.碘代乙酸和氟化物可以破坏GAPDH活性中心的巯基，从而抑制糖酵解。&lt;br /&gt;
** B.砷酸可以与还原性的硫辛酰胺形成共价复合物，同时抑制丙酮酸脱氢和三羧酸循环。&lt;br /&gt;
** C.UDP-D-半乳糖-4-差向异构酶需要NAD+作为辅酶。&lt;br /&gt;
** D.F-2,6-BP是丙酮酸激酶的别构激活剂，介导一种前馈作用。&lt;br /&gt;
* &#039;&#039;&#039;FFTF&#039;&#039;&#039;，A选项，氟化物是烯醇化酶的抑制剂，此处应为有机汞。B选项，砷酸的作用是冒充磷酸基团进入1,3-二磷酸甘油酸后自发水解，起到解偶联作用；亚砷酸的作用才是抑制丙酮酸脱氢酶系等。C选项确实是对的，参见王镜岩有关于半乳糖进入糖酵解的部分内容。D选项应为F-1,6-BP，但是确实是前馈作用。&lt;br /&gt;
&lt;br /&gt;
===分子生物学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===植物学===&lt;br /&gt;
====基础====&lt;br /&gt;
&lt;br /&gt;
* 关于植物的营养器官，你认为正确的是：&lt;br /&gt;
** A. 初生结构里韧皮部是外始式的&lt;br /&gt;
** B. 通常维管束中自外而内看，先出现梯纹或网纹导管，然后是环纹或螺纹导管&lt;br /&gt;
** C. 仙人掌刺和皂荚刺同源&lt;br /&gt;
** D. 横切一个枝叶茂盛的细茎植物，会出现维管横断，切向切可见纤维样的维管射线（mt）&lt;br /&gt;
* &#039;&#039;&#039;TTFF&#039;&#039;&#039;，A. 韧皮部在茎和根中都如此；B. 维管束（维管束在茎中）木质部是外始式的，原生木质部是环纹/螺纹导管而后生木质部是梯纹/网纹/孔纹导管；C. 仙人掌刺是叶，而皂荚刺是茎；D. 维管射线在切向面是纺锤状，或者题目改成“径向切”，也对。&lt;br /&gt;
&lt;br /&gt;
====较难题====&lt;br /&gt;
===植物生理学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===微生物学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===动物学===&lt;br /&gt;
====基础====&lt;br /&gt;
&lt;br /&gt;
* 1 A.在海边捡到一枚软骨脑匣，可确定它的拥有者有角质齿  B.切断直接连接田螺两侧神经节的神经索，对其外套膜生理功能产生影响  C.一颗石子深入蚌的内脏团中，并不会长出珍珠  D.田螺的右侧很强大，其腹脏神经索前段位于食道上部，而雄性右侧触角特化为交接器&lt;br /&gt;
&lt;br /&gt;
FTFTa可能是软骨鱼七鳃鳗或软体，只有软骨鱼没有角质齿&lt;br /&gt;
&lt;br /&gt;
b两侧神经索并不直接相连，硬切会切到脑神经节&lt;br /&gt;
&lt;br /&gt;
c掉外套膜会长&lt;br /&gt;
&lt;br /&gt;
d没问题&lt;br /&gt;
&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
# 判断下列关于无脊椎动物的说法正误 &lt;br /&gt;
## A.偕老同穴属于寻常海绵纲，复沟型，鞭毛室大 &lt;br /&gt;
## B.人如果误食猪带绦虫由孕卵节片产生的虫卵会导致猪带绦虫极易附于小肠黏膜  &lt;br /&gt;
## C.海盘车真体腔发达，体腔液中含两种变形细胞，有吞噬作用  &lt;br /&gt;
## D.毛颚动物的体腔为次生体腔，雌雄异体，无循环系统和排泄系统&lt;br /&gt;
## &#039;&#039;&#039;FFTF&#039;&#039;&#039; A，F偕老同穴属于六放海绵纲  B，误食囊尾蚴会导致上述结果  D，雌雄同体（D好像有点偏）&lt;br /&gt;
# 下列有关于六足亚门变态发育正确的是：&lt;br /&gt;
#* A.蝉蛹，每个人都爱吃，但你真的了解蝉蛹吗？蝉是一种完全变态的昆虫，因此有蝉蛹之说。&lt;br /&gt;
#* B.表变态为内颚纲昆虫特有，胚后发育仅为个体增大，性器官渐成熟。&lt;br /&gt;
#* C.大部分同翅目属于渐变态，但粉虱科和雌性蚧壳虫为特殊的过渐变态类型。&lt;br /&gt;
#* D.复变态在某些幼虫营寄生生活的昆虫中具有，如捻翅目。&lt;br /&gt;
# &#039;&#039;&#039;FTFT&#039;&#039;&#039;。A选项的由来是某人考试中猛然想起“蝉蛹”一词，果断确定同翅目完全变态的一次悲催经历。实际上蝉是渐变态，鬼知道蝉蛹是哪个天才发明的，应该是蚕蛹才对。C选项应为雄性蚧壳虫，过渐变态类还有缨翅目。BD为普通昆虫学原文。&lt;br /&gt;
&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
#&lt;br /&gt;
#&lt;br /&gt;
&lt;br /&gt;
===生理学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
# 下列有关肺通气的说法正确的是：&lt;br /&gt;
* A.根据物理学原理，气体流动需要压力梯度的存在，故肺泡气与外界大气之间的压力差是实现肺通气的原动力&lt;br /&gt;
* B.腔静脉和胸导管位于胸膜腔内，而气胸会导致胸膜腔内压减小或消失，进而引起血液和淋巴回流受阻&lt;br /&gt;
* C.肺弹性阻力可以用肺顺应性来表示，后者等于肺容积变化除以肺内压变化&lt;br /&gt;
* D.一般情况下，青壮年男性和运动员以腹式呼吸为主&lt;br /&gt;
# &#039;&#039;&#039;FFFT&#039;&#039;&#039;。A选项，肺泡气与外界大气之间的压力差是肺通气的直接动力，而原动力来自于呼吸肌的收缩。B选项，胸膜腔内只有一层浆液，没有任何器官，腔静脉和胸导管位于胸腔内。C选项，在测定肺顺应性时，呼吸道内无气体流动，肺内压（肺泡内气体的压力）等于大气压，前后差值为0。计算顺应性时应使用跨肺压（胸膜腔内压和肺内压之差）。D选项参见生理学第十版P136，虽然确实不知道为什么。&lt;br /&gt;
&lt;br /&gt;
===生态学和行为学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===遗传学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===演化生物学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===生物信息学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===生物技术===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===综合题/文献题===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E5%85%B1%E5%90%8C%E5%87%BA%E9%A2%98%EF%BC%88%E6%97%A8%E5%9C%A8%E6%94%B6%E9%9B%86%E5%B9%B3%E6%97%B6%E6%95%A3%E5%87%BA%E7%9A%84%E9%A2%98%EF%BC%8C%E4%BD%A0%E8%A6%81%E6%98%AF%E5%96%9C%E6%AC%A2%E4%B9%9F%E5%8F%AF%E4%BB%A5%E6%B3%A1%E5%9C%A8%E8%BF%99%E9%87%8C%E5%87%BA%E9%A2%98%EF%BC%89&amp;diff=7046</id>
		<title>共同出题（旨在收集平时散出的题，你要是喜欢也可以泡在这里出题）</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E5%85%B1%E5%90%8C%E5%87%BA%E9%A2%98%EF%BC%88%E6%97%A8%E5%9C%A8%E6%94%B6%E9%9B%86%E5%B9%B3%E6%97%B6%E6%95%A3%E5%87%BA%E7%9A%84%E9%A2%98%EF%BC%8C%E4%BD%A0%E8%A6%81%E6%98%AF%E5%96%9C%E6%AC%A2%E4%B9%9F%E5%8F%AF%E4%BB%A5%E6%B3%A1%E5%9C%A8%E8%BF%99%E9%87%8C%E5%87%BA%E9%A2%98%EF%BC%89&amp;diff=7046"/>
		<updated>2025-05-08T00:40:40Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​在解析部分加上了题目&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;==题目==&lt;br /&gt;
一些话：以新联赛不定项方式（四个选项，判断正误）的形式出题。难度不用超过考试太多，模仿到联赛或国赛出题风格，节奏与难度的题目最佳。减少过于困难的题目，如果本身是追求难度、创意或者偏的知识点，可以在每学科&#039;&#039;&#039;【较难题】&#039;&#039;&#039;中出题。&lt;br /&gt;
&lt;br /&gt;
希望达到这样一种境界：看到书发现好的点时，就来出一题&lt;br /&gt;
&lt;br /&gt;
===梗百科/生竞常识===&lt;br /&gt;
&lt;br /&gt;
# 关于主流教材，你觉得正确的是：&lt;br /&gt;
#* A. 细胞生物学第五版的主编是翟中和院士&lt;br /&gt;
#* B. 普通动物学的版次在00年代&lt;br /&gt;
#* C. 植物学最严谨的教材是马炜梁&lt;br /&gt;
#* D. 生理学最新版的作者是朱大年&lt;br /&gt;
# 关于生物竞赛，你觉得正确的是：&lt;br /&gt;
#* A. 省一一般对于升学有较大优势&lt;br /&gt;
#* B. 生物竞赛是以高中生物学为基础，本科教材为拓展进行命题&lt;br /&gt;
#* C. 每年联赛评议完题目，争议题都会删除&lt;br /&gt;
#* D. 又名背书竞赛，完全不需要理解&lt;br /&gt;
# 关于生物竞赛教师或机构，你觉得正确的是：&lt;br /&gt;
#* A. 朱斌曾在质心任职，现在在猿辅导&lt;br /&gt;
#* B. 喵健曾在质心任职，现在在北斗学友&lt;br /&gt;
#* C. 北斗学友其实是一只青蛙&lt;br /&gt;
#* D. 汇智其实是四字机构，金石也是四字机构&lt;br /&gt;
# 关于下列说法，你认为正确的是：&lt;br /&gt;
#* A. 杨sir是南京大学教授，讲授生物系和医学部的生物化学，已退休&lt;br /&gt;
#* B. 周德庆是微生物学教程主编，目前已主编至第四版&lt;br /&gt;
#* C. 最新版王镜岩生物化学又称“大生化”，主编是王镜岩和朱圣庚&lt;br /&gt;
#* D. 刘祖洞遗传学是复旦系教材，而戴灼华遗传学是北大系教材&lt;br /&gt;
#根据生物竞赛的不定项得分规则，如果你在考试时碰到了一道不会的题，下列说法正确的是：&lt;br /&gt;
#* A. 如果该题只有一个选项为T，则选择FFFF比选择TFFF得分的数学期望高&lt;br /&gt;
#* B. 如果该题只有两个选项为T，则任意选择两个T两个F，得分的数学期望为13/30&lt;br /&gt;
#* C. 不可能出现选项为FFFF的情况&lt;br /&gt;
#* D. 如果该题只有三个选项为T，则任意选择三个T一个F，得分的方差为0.12&lt;br /&gt;
&lt;br /&gt;
===细胞生物学===&lt;br /&gt;
====基础====&lt;br /&gt;
&lt;br /&gt;
# 多细胞有机体的三种识别系统是：&lt;br /&gt;
#* A. 抗原-抗体&lt;br /&gt;
#* B. 酶和底物&lt;br /&gt;
#* C. 配体-受体&lt;br /&gt;
#* D. 细胞-细胞（mt）&lt;br /&gt;
&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
# 关于整联蛋白，你认为正确的有：&lt;br /&gt;
#* A. 是穿膜的异质二聚体&lt;br /&gt;
#* B. α 要和 RGD 识别，然后和纤连蛋白结合&lt;br /&gt;
#* C. β 头部的硫元素比较多，但是 α 大小两部的交界处则几乎没有&lt;br /&gt;
#* D. β 受体与 RGD 识别后，通过黏着斑蛋白与肌动蛋白结合（mt）&lt;br /&gt;
&lt;br /&gt;
===生物化学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
# 下列有关于糖类的说法正确的是：&lt;br /&gt;
#* A.对于D-葡萄糖来说，椅式构象比船式构象更稳定。&lt;br /&gt;
#* B.实际应用中，常用苯肼的成脎反应区分D-葡萄糖和D-果糖。&lt;br /&gt;
#* C.热的稀硝酸是强氧化剂，可将D-半乳糖氧化为D-半乳糖二酸。&lt;br /&gt;
#* D.单糖环化后形成半缩醛/半缩酮羟基，会失去其还原性。&lt;br /&gt;
# 黄天在上，我与赌毒不共戴天！请问下列反应生成黄色物质的有：&lt;br /&gt;
#* A.己糖+间苯三酚/浓盐酸&lt;br /&gt;
#* B.茚三酮+Pro&lt;br /&gt;
#* C.Tyr+浓硫酸+浓盐酸&lt;br /&gt;
#* D.戊糖+甲基间苯二酚/浓盐酸&lt;br /&gt;
# 下列关于糖代谢的说法正确的是：&lt;br /&gt;
#* A.碘代乙酸和氟化物可以破坏GAPDH活性中心的巯基，从而抑制糖酵解。&lt;br /&gt;
#* B.砷酸可以与还原性的硫辛酰胺形成共价复合物，同时抑制丙酮酸脱氢和三羧酸循环。&lt;br /&gt;
#* C.UDP-D-半乳糖-4-差向异构酶需要NAD+作为辅酶。&lt;br /&gt;
#* D.F-2,6-BP是丙酮酸激酶的别构激活剂，介导一种前馈作用。&lt;br /&gt;
&lt;br /&gt;
===分子生物学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===植物学===&lt;br /&gt;
====基础====&lt;br /&gt;
&lt;br /&gt;
# 关于植物的营养器官，你认为正确的是：&lt;br /&gt;
#* A. 初生结构里韧皮部是外始式的&lt;br /&gt;
#* B. 通常维管束中自外而内看，先出现梯纹或网纹导管，然后是环纹或螺纹导管&lt;br /&gt;
#* C. 仙人掌刺和皂荚刺同源&lt;br /&gt;
#* D. 横切一个枝叶茂盛的细茎植物，会出现维管横断，切向切可见纤维样的维管射线（mt）&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
===植物生理学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===微生物学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===动物学===&lt;br /&gt;
====基础====&lt;br /&gt;
1.A.在海边捡到一枚软骨脑匣，可确定它的拥有者有角质齿&lt;br /&gt;
&lt;br /&gt;
B.切断直接连接田螺两侧神经节的神经索，对其外套膜生理功能产生影响&lt;br /&gt;
&lt;br /&gt;
C.一颗石子深入蚌的内脏团中，并不会长出珍珠&lt;br /&gt;
&lt;br /&gt;
D.田螺的右侧很强大，其腹脏神经索前段位于食道上部，而雄性右侧触角特化为交接器&lt;br /&gt;
&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
# 判断下列关于无脊椎动物的说法正误 A.偕老同穴属于寻常海绵纲，复沟型，鞭毛室大  B.人如果误食猪带绦虫由孕卵节片产生的虫卵会导致猪带绦虫极易附于小肠黏膜  C.海盘车真体腔发达，体腔液中含两种变形细胞，有吞噬作用  D.毛颚动物的体腔为次生体腔，雌雄异体，无循环系统和排泄系统&lt;br /&gt;
# 下列有关于六足亚门变态发育正确的是：&lt;br /&gt;
#* A.蝉蛹，每个人都爱吃，但你真的了解蝉蛹吗？蝉是一种完全变态的昆虫，因此有蝉蛹之说。&lt;br /&gt;
#* B.表变态为内颚纲昆虫特有，胚后发育仅为个体增大，性器官渐成熟。&lt;br /&gt;
#* C.大部分同翅目属于渐变态，但粉虱科和雌性蚧壳虫为特殊的过渐变态类型。&lt;br /&gt;
#* D.复变态在某些幼虫营寄生生活的昆虫中具有，如捻翅目。&lt;br /&gt;
&lt;br /&gt;
===生理学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
# 下列有关肺通气的说法正确的是：&lt;br /&gt;
#* A.根据物理学原理，气体流动需要压力梯度的存在，故肺泡气与外界大气之间的压力差是实现肺通气的原动力&lt;br /&gt;
#* B.腔静脉和胸导管位于胸膜腔内，而气胸会导致胸膜腔内压减小或消失，进而引起血液和淋巴回流受阻&lt;br /&gt;
#* C.肺弹性阻力可以用肺顺应性来表示，后者等于肺容积变化除以肺内压变化&lt;br /&gt;
#* D.一般情况下，青壮年男性和运动员以腹式呼吸为主&lt;br /&gt;
&lt;br /&gt;
===生态学和行为学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===遗传学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===演化生物学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===生物信息学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===生物技术===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===综合题/文献题===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
==&#039;&#039;&#039;答案与解析（以及对题目本身的讨论和勘误）&#039;&#039;&#039;==&lt;br /&gt;
===梗百科/生竞常识===&lt;br /&gt;
&lt;br /&gt;
# &#039;&#039;&#039;FTFF&#039;&#039;&#039;&lt;br /&gt;
# &#039;&#039;&#039;FTFF&#039;&#039;&#039;，关于 C，其实还有答案更改&lt;br /&gt;
# &#039;&#039;&#039;TTFT&#039;&#039;&#039;，关于 C，在 2025BAT1 的第 33 题中，明确写着那个东西是爬行动物（原作是鳄鱼），而青蛙是两栖动物（他人注:我总觉得这画的是鳄鱼 orz）（他人注：vx 表情包搜索“抹茶旦旦”，你会找到“我是小鳄鱼谢谢”之类描述，尊重原作吧，yysy 画得很抽象）（本人注：所以 C 选项是 F ，不是青蛙）&lt;br /&gt;
# &#039;&#039;&#039;TTFT&#039;&#039;&#039;&lt;br /&gt;
# &#039;&#039;&#039;TTFT&#039;&#039;&#039;  A.选择TFFF得分数学期望为(2+0.2+0.2+0.2)/4＝0.65，选择FFFF得分数学期望为1(单选题不会做，4个F走起) . B.六种情况，用E(X)的公式计算即可. D.方差公式D(X)＝E(X²)-E²（X），据此计算。本题考查随机变量的均值和方差，属于基础题[[文件:屏幕截图 19-3-2025 213155 .jpg|缩略图|BAT1的第33题]]&lt;br /&gt;
&lt;br /&gt;
===细胞生物学===&lt;br /&gt;
&lt;br /&gt;
==== 基础 ====&lt;br /&gt;
&lt;br /&gt;
# 多细胞有机体的三种识别系统是：&lt;br /&gt;
#* A. 抗原-抗体&lt;br /&gt;
#* B. 酶和底物&lt;br /&gt;
#* C. 配体-受体&lt;br /&gt;
#* D. 细胞-细胞（mt）&lt;br /&gt;
&#039;&#039;&#039;TTFT&#039;&#039;&#039;，记忆题。笔者认为，自己编的C选项配体-受体应该也算&#039;&#039;广义的酶-受体&#039;&#039;或者&#039;&#039;细胞-细胞的一环&#039;&#039;。题目中这三种是：免疫反应 催化反应和信号传递。&lt;br /&gt;
&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
# 关于整联蛋白，你认为正确的有：&lt;br /&gt;
#* A. 是穿膜的异质二聚体&lt;br /&gt;
#* B. α 要和 RGD 识别，然后和纤连蛋白结合&lt;br /&gt;
#* C. β 头部的硫元素比较多，但是 α 大小两部的交界处则几乎没有&lt;br /&gt;
#* D. β 受体与 RGD 识别后，通过黏着斑蛋白与肌动蛋白结合（mt）&lt;br /&gt;
&lt;br /&gt;
# &#039;&#039;&#039;TFFF&#039;&#039;&#039;，A. 基础识记；B. αβ 反了，这里是 β；C.α大小两部要通过双硫键相连；D. β 先和裸蛋白结合，然后和肌动蛋白结合。（这部分比较乱，参见王金发细胞生物学 P112-P113）&lt;br /&gt;
&lt;br /&gt;
===生物化学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
*下列有关于糖类的说法正确的是：&lt;br /&gt;
** A.对于D-葡萄糖来说，椅式构象比船式构象更稳定。&lt;br /&gt;
** B.实际应用中，常用苯肼的成脎反应区分D-葡萄糖和D-果糖。&lt;br /&gt;
** C.热的稀硝酸是强氧化剂，可将D-半乳糖氧化为D-半乳糖二酸。&lt;br /&gt;
** D.单糖环化后形成半缩醛/半缩酮羟基，会失去其还原性。&lt;br /&gt;
* &#039;&#039;&#039;TFFF&#039;&#039;&#039;，A选项确实是对的，杨sir上有讲；B选项是杨sir小quiz的原题，由于苯肼与单糖在1、2号位反应，而D-葡萄糖、D-果糖、D-半乳糖的1、2号位是完全相同的，所以并不能区分；C选项，如果你闲来无事仔细观察一下半乳糖的分子结构式，你会发现它被氧化为糖二酸后会发生内消旋，失去手性，这点在王镜岩上有讲；D选项比较明显。&lt;br /&gt;
* 黄天在上，我与赌毒不共戴天！请问下列反应生成黄色物质的有：&lt;br /&gt;
** A.己糖+间苯三酚/浓盐酸&lt;br /&gt;
** B.茚三酮+Pro&lt;br /&gt;
** C.Tyr+浓硫酸+浓盐酸&lt;br /&gt;
** D.戊糖+甲基间苯二酚/浓盐酸&lt;br /&gt;
* &#039;&#039;&#039;TTTF&#039;&#039;&#039;，A选项间苯三酚反应，戊糖与间苯三酚/浓盐酸反应生成朱红色物质，其他单糖与间苯三酚/浓盐酸生成黄色物质。B过于经典。C的名字就叫黄色反应。D选项应为蓝绿色物质。&lt;br /&gt;
* 下列关于糖代谢的说法正确的是：&lt;br /&gt;
** A.碘代乙酸和氟化物可以破坏GAPDH活性中心的巯基，从而抑制糖酵解。&lt;br /&gt;
** B.砷酸可以与还原性的硫辛酰胺形成共价复合物，同时抑制丙酮酸脱氢和三羧酸循环。&lt;br /&gt;
** C.UDP-D-半乳糖-4-差向异构酶需要NAD+作为辅酶。&lt;br /&gt;
** D.F-2,6-BP是丙酮酸激酶的别构激活剂，介导一种前馈作用。&lt;br /&gt;
* &#039;&#039;&#039;FFTF&#039;&#039;&#039;，A选项，氟化物是烯醇化酶的抑制剂，此处应为有机汞。B选项，砷酸的作用是冒充磷酸基团进入1,3-二磷酸甘油酸后自发水解，起到解偶联作用；亚砷酸的作用才是抑制丙酮酸脱氢酶系等。C选项确实是对的，参见王镜岩有关于半乳糖进入糖酵解的部分内容。D选项应为F-1,6-BP，但是确实是前馈作用。&lt;br /&gt;
&lt;br /&gt;
===分子生物学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===植物学===&lt;br /&gt;
====基础====&lt;br /&gt;
&lt;br /&gt;
* 关于植物的营养器官，你认为正确的是：&lt;br /&gt;
** A. 初生结构里韧皮部是外始式的&lt;br /&gt;
** B. 通常维管束中自外而内看，先出现梯纹或网纹导管，然后是环纹或螺纹导管&lt;br /&gt;
** C. 仙人掌刺和皂荚刺同源&lt;br /&gt;
** D. 横切一个枝叶茂盛的细茎植物，会出现维管横断，切向切可见纤维样的维管射线（mt）&lt;br /&gt;
* &#039;&#039;&#039;TTFF&#039;&#039;&#039;，A. 韧皮部在茎和根中都如此；B. 维管束（维管束在茎中）木质部是外始式的，原生木质部是环纹/螺纹导管而后生木质部是梯纹/网纹/孔纹导管；C. 仙人掌刺是叶，而皂荚刺是茎；D. 维管射线在切向面是纺锤状，或者题目改成“径向切”，也对。&lt;br /&gt;
&lt;br /&gt;
====较难题====&lt;br /&gt;
===植物生理学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===微生物学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===动物学===&lt;br /&gt;
====基础====&lt;br /&gt;
&lt;br /&gt;
* 1 A.在海边捡到一枚软骨脑匣，可确定它的拥有者有角质齿  B.切断直接连接田螺两侧神经节的神经索，对其外套膜生理功能产生影响  C.一颗石子深入蚌的内脏团中，并不会长出珍珠  D.田螺的右侧很强大，其腹脏神经索前段位于食道上部，而雄性右侧触角特化为交接器&lt;br /&gt;
&lt;br /&gt;
FTFTa可能是软骨鱼七鳃鳗或软体，只有软骨鱼没有角质齿&lt;br /&gt;
&lt;br /&gt;
b两侧神经索并不直接相连，硬切会切到脑神经节&lt;br /&gt;
&lt;br /&gt;
c掉外套膜会长&lt;br /&gt;
&lt;br /&gt;
d没问题&lt;br /&gt;
&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
# 判断下列关于无脊椎动物的说法正误 &lt;br /&gt;
## A.偕老同穴属于寻常海绵纲，复沟型，鞭毛室大 &lt;br /&gt;
## B.人如果误食猪带绦虫由孕卵节片产生的虫卵会导致猪带绦虫极易附于小肠黏膜  &lt;br /&gt;
## C.海盘车真体腔发达，体腔液中含两种变形细胞，有吞噬作用  &lt;br /&gt;
## D.毛颚动物的体腔为次生体腔，雌雄异体，无循环系统和排泄系统&lt;br /&gt;
## &#039;&#039;&#039;FFTF&#039;&#039;&#039; A，F偕老同穴属于六放海绵纲  B，误食囊尾蚴会导致上述结果  D，雌雄同体（D好像有点偏）&lt;br /&gt;
# 下列有关于六足亚门变态发育正确的是：&lt;br /&gt;
#* A.蝉蛹，每个人都爱吃，但你真的了解蝉蛹吗？蝉是一种完全变态的昆虫，因此有蝉蛹之说。&lt;br /&gt;
#* B.表变态为内颚纲昆虫特有，胚后发育仅为个体增大，性器官渐成熟。&lt;br /&gt;
#* C.大部分同翅目属于渐变态，但粉虱科和雌性蚧壳虫为特殊的过渐变态类型。&lt;br /&gt;
#* D.复变态在某些幼虫营寄生生活的昆虫中具有，如捻翅目。&lt;br /&gt;
# &#039;&#039;&#039;FTFT&#039;&#039;&#039;。A选项的由来是某人考试中猛然想起“蝉蛹”一词，果断确定同翅目完全变态的一次悲催经历。实际上蝉是渐变态，鬼知道蝉蛹是哪个天才发明的，应该是蚕蛹才对。C选项应为雄性蚧壳虫，过渐变态类还有缨翅目。BD为普通昆虫学原文。&lt;br /&gt;
&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
#&lt;br /&gt;
#&lt;br /&gt;
&lt;br /&gt;
===生理学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
&lt;br /&gt;
# 下列有关肺通气的说法正确的是：&lt;br /&gt;
* A.根据物理学原理，气体流动需要压力梯度的存在，故肺泡气与外界大气之间的压力差是实现肺通气的原动力&lt;br /&gt;
* B.腔静脉和胸导管位于胸膜腔内，而气胸会导致胸膜腔内压减小或消失，进而引起血液和淋巴回流受阻&lt;br /&gt;
* C.肺弹性阻力可以用肺顺应性来表示，后者等于肺容积变化除以肺内压变化&lt;br /&gt;
* D.一般情况下，青壮年男性和运动员以腹式呼吸为主&lt;br /&gt;
# &#039;&#039;&#039;FFFT&#039;&#039;&#039;。A选项，肺泡气与外界大气之间的压力差是肺通气的直接动力，而原动力来自于呼吸肌的收缩。B选项，胸膜腔内只有一层浆液，没有任何器官，腔静脉和胸导管位于胸腔内。C选项，在测定肺顺应性时，呼吸道内无气体流动，肺内压（肺泡内气体的压力）等于大气压，前后差值为0。计算顺应性时应使用跨肺压（胸膜腔内压和肺内压之差）。D选项参见生理学第十版P136，虽然确实不知道为什么。&lt;br /&gt;
&lt;br /&gt;
===生态学和行为学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===遗传学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===演化生物学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===生物信息学===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===生物技术===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;br /&gt;
===综合题/文献题===&lt;br /&gt;
====基础====&lt;br /&gt;
====较难题====&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E5%8F%A3%E8%AF%80%E5%AD%A6&amp;diff=7024</id>
		<title>生物口诀学</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E5%8F%A3%E8%AF%80%E5%AD%A6&amp;diff=7024"/>
		<updated>2025-05-07T15:11:09Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* 7/9/10定律 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;来吧&lt;br /&gt;
&lt;br /&gt;
&amp;lt;s&amp;gt;这里是整个生物圈笑话最多的地方&amp;lt;/s&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== 跨学科案例分析 ==&lt;br /&gt;
&lt;br /&gt;
==== 7/9/10定律 ====&lt;br /&gt;
&lt;br /&gt;
须Vk参与合成的凝血因子：2、7、9、10；&lt;br /&gt;
&lt;br /&gt;
具有副交感性质的脑神经：3、7、9、10；&lt;br /&gt;
&lt;br /&gt;
运动-感觉混合脑神经：5、7、9、10；&lt;br /&gt;
&lt;br /&gt;
（其实细胞生物学有个很像的，起始Caspase：2、8、9、10）&lt;br /&gt;
&lt;br /&gt;
（蚯蚓的心脏7.9.12.13节，大致是这样？）&lt;br /&gt;
&lt;br /&gt;
==== 3/6定律 ====&lt;br /&gt;
&lt;br /&gt;
无尾两栖类及之后保留的动脉弓：3、4、6&lt;br /&gt;
&lt;br /&gt;
运动脑神经：3、4、6、11、12&lt;br /&gt;
&lt;br /&gt;
效应Caspase：3、6、7&lt;br /&gt;
&lt;br /&gt;
== 第一部分 ==&lt;br /&gt;
&lt;br /&gt;
===&#039;&#039;&#039;&amp;lt;big&amp;gt;生物化学与分子生物学&amp;lt;/big&amp;gt;&#039;&#039;&#039;===&lt;br /&gt;
&lt;br /&gt;
==== 结构生物化学 ====&lt;br /&gt;
&lt;br /&gt;
===== &#039;&#039;&#039;适合形成二级结构的氨基酸&#039;&#039;&#039; =====&lt;br /&gt;
α螺旋：CALM HK EQ冷静香港人有情商&lt;br /&gt;
&lt;br /&gt;
β折叠：I Very Want To Fuck You取首字母（为了防止记反你可以记一个“&#039;被它fuck”）&lt;br /&gt;
&lt;br /&gt;
===== &#039;&#039;&#039;各种各样氨基酸&#039;&#039;&#039; =====&lt;br /&gt;
分支缬二亮，丝苏酪有羟。苯色酪芳香，严格酮赖亮。&lt;br /&gt;
&lt;br /&gt;
糖酮异苯酪色苏，酸天谷碱赖精组，稳缬甲丙甘丝苏（第一个氨基酸稳定的）&lt;br /&gt;
&lt;br /&gt;
不转氨，赖苏脯，一碳来甘色丝组。&lt;br /&gt;
&lt;br /&gt;
===== 氨基酸分类+单字母缩写 =====&lt;br /&gt;
极性无电荷：年前速通MC（NQSTMC；天冬酰胺 谷氨酰胺 丝 苏 甲硫 半胱）&lt;br /&gt;
&lt;br /&gt;
芳香族：吴亦凡（WYF；色 酪 苯丙）另：特别无厘头的联想：280nm紫外吸收→“色aa”→Trp←Trump←共和党（红色）&lt;br /&gt;
&lt;br /&gt;
极性负电荷：大鹅（DE；天 谷 ；大鹅脾气暴躁，十分negative（消极，也是负电））&lt;br /&gt;
&lt;br /&gt;
极性正电荷：好客人（HKR；组 赖 精；一看就是个积极向上的词嘛，正电）&lt;br /&gt;
&lt;br /&gt;
一&#039;&#039;&#039;组&#039;&#039;&#039;很&#039;&#039;&#039;精&#039;&#039;&#039;的人耍&#039;&#039;&#039;赖&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
非极性：VIP延迟（低）（VIP：缬 异 脯；延迟即LAG：&amp;lt;s&amp;gt;晾饼干&amp;lt;/s&amp;gt;亮 丙 甘；VIP延迟低所以不急，非急性（）&lt;br /&gt;
&lt;br /&gt;
（欢迎补充~）&lt;br /&gt;
&lt;br /&gt;
===== 氨基酸单字母记忆 =====&lt;br /&gt;
# “看到天，想到地”（天冬氨酸D） 天冬氨酸四个C，字母D第四个。谷氨酸五个C，字母E第五个。&lt;br /&gt;
# &amp;lt;s&amp;gt;背得差不多之后把二十六个字母全写出来然后一一对应，多来几次，效果极佳。&amp;lt;/s&amp;gt;&lt;br /&gt;
# 砍人后的服务员，去哪埋藏尸体？谷爱凌VIP！！！&amp;lt;s&amp;gt;{来源双水，侵删}&amp;lt;/s&amp;gt;&lt;br /&gt;
## 砍人后：KRH-Lys/Arg/His【赖、精、组→正电】&lt;br /&gt;
## 的：DE-Asp/Glu【天冬、谷→负电】&lt;br /&gt;
## 服务员：FWY-Phe/Trp/Tyr【苯丙、色、酪→芳香族】&lt;br /&gt;
## 去哪：QN-Gln/Asn【谷氨酰胺、天冬酰胺】&lt;br /&gt;
## 埋藏尸体：MCST-Met/Cys/Ser/Thr【甲硫、半胱、丝、苏→这6个是极性不带电的，以上14个都是极性的】&lt;br /&gt;
## 谷爱凌VIP：GALVIP-Gly/Ala/Leu/Val/Ile/Pro【甘、丙、亮、缬、异亮、脯→非极性{注：极性与非极性氨基酸存在争议}】&lt;br /&gt;
## 另外注意MCST和GALVIP都是以首字母作为缩写的&lt;br /&gt;
&lt;br /&gt;
===== 必需氨基酸 =====&lt;br /&gt;
* 一组笨蛋来宿舍晾鞋 （Ile His Phe Met Lys Thr Trp Leu Val）&lt;br /&gt;
* 携一两本单色书来（此处“一两”同时指代Leu和Ile）&lt;br /&gt;
* 甲携来一本亮色书 （Met Val Lys Ile Phe Leu Trp Thr）&lt;br /&gt;
* 甲写来一两本黄色书（Met Val Lys Ile Leu Phe His Trp Thr，其中“黄”首字母H，His现已被证明为必需氨基酸）&lt;br /&gt;
* 笨蛋来宿舍住晾一晾鞋（Phe、Met、Lys、Thr、Trp、His、Leu、Ile、Val）&lt;br /&gt;
&lt;br /&gt;
===== 非必需氨基酸 =====&lt;br /&gt;
这个口诀非常非常的不厚道，看不懂的人希望一辈子都不要看懂。&lt;br /&gt;
&lt;br /&gt;
我为写出了这个口诀而忏悔，忏悔自己脖子上简直是一堆废料里面长了一点脑子。&lt;br /&gt;
&lt;br /&gt;
同时祈祷谷谷不要看到这个口诀🙏🏻，否则可能友尽……&lt;br /&gt;
&lt;br /&gt;
* 谷谷是一个喜欢甘雨（原神角色)的孩子，有一天他变成了病娇。&lt;br /&gt;
&lt;br /&gt;
“&#039;&#039;&amp;lt;big&amp;gt;病谷谷天天挠半光甘&amp;lt;s&amp;gt;雨&amp;lt;/s&amp;gt;脯丝&amp;lt;/big&amp;gt;&#039;&#039;”&lt;br /&gt;
&lt;br /&gt;
丙谷谷天天酪半胱甘    脯丝&lt;br /&gt;
&lt;br /&gt;
===== 五大氨基酸家族口诀 =====&lt;br /&gt;
谷氨酰脯精属谷，天酰甲苏赖属天，半胱与胱丝属丝。&lt;br /&gt;
&lt;br /&gt;
缬亮丙，则属丙，苯色酪，属芳香，组氨酸自成一家。&lt;br /&gt;
&lt;br /&gt;
===== 胶原蛋白诗一首 =====&lt;br /&gt;
一五并驱骨中现，致密结缔很常见。（韧带、真皮、肌腱、巩膜或角膜）&lt;br /&gt;
&lt;br /&gt;
九侧贴二共十一，脊索软骨玻璃体。&lt;br /&gt;
&lt;br /&gt;
三皮血管内器官，症状凄凄同五惨。（皮肤易损、血管易破、关节松软）&lt;br /&gt;
&lt;br /&gt;
四网十八初基膜，后者视网膜脱落。（缺十八的症状）&lt;br /&gt;
&lt;br /&gt;
七鳞上皮锚纤维，十七纤维共起疱。（鳞状上皮、锚定纤维）&lt;br /&gt;
&lt;br /&gt;
一二三五九纤维，十七十八非纤维。&lt;br /&gt;
&lt;br /&gt;
四基蛋羟赖交联，次溴辅硫亚胺键。（来自杨Sir）&lt;br /&gt;
&lt;br /&gt;
==== 脂化学 ====&lt;br /&gt;
必须脂肪酸：亚油酸、alpha-亚麻酸。&lt;br /&gt;
&lt;br /&gt;
yama-亚麻酸不是必须的，why？&lt;br /&gt;
&lt;br /&gt;
因为干妈（gama）是非必需的（来自杨sir&lt;br /&gt;
&lt;br /&gt;
==== 代谢生物化学 ====&lt;br /&gt;
&lt;br /&gt;
===== 三羧酸循环 =====&lt;br /&gt;
1.您吵，您顺意吵，（吵得）铜壶呼盐瓶（柠檬酸，顺乌头酸，异柠檬酸，草酰琥珀酸，α-酮戊二酸，琥珀酰CoA，琥珀酸，延胡索酸，苹果酸，以及口诀中未体现的草酰乙酸）——杨荣武&lt;br /&gt;
&lt;br /&gt;
2.宁异勿同，虎虎言平，一同平虎，两虎一能——刘不言&lt;br /&gt;
&lt;br /&gt;
前两句是中间产物，后两句是产能反应，异柠檬酸→α-酮戊二酸（“一”）α-酮戊二酸→琥珀酰CoA（“同”）苹果酸→草酰乙酸（“平”）分别生成一分子NADH，琥珀酸→延胡索酸（“虎”）生成一分子FADH2，琥珀酰CoA→琥珀酸（“两虎”）生成一分子GTP&lt;br /&gt;
&lt;br /&gt;
理解的话就是两只老虎住在同一座山上，他们宁愿不同也不要相同，但有一天他们和好了，于是他们说我们和平共处吧；后来有一天，一群人一起上山要镇压这两只老虎，两只老虎中肯定有一只是很能打的&lt;br /&gt;
&lt;br /&gt;
3.一个小故事&lt;br /&gt;
&lt;br /&gt;
从前，有一个很酸很酸的柠檬（柠檬酸），他在街上走，遇到了一只很喜欢住在别人头上的乌贼（顺乌头酸），乌贼住在了柠檬的头上，柠檬变成了柠檬中的异类（异柠檬酸），柠檬变成了异类，他不能回家，他的家让给了同屋的一对酸夫妻（α-酮戊二酸），这对酸夫妻生了两个娃，分别叫琥珀酰和CoA，CoA是小儿子比较受宠，琥珀酰就很酸，变成了琥珀酸，有一天琥珀酸沿着湖边走，思索自己为什么不受宠（延胡索酸），他走着走着遇到了一个苹果，于是他把苹果捡起来吃了，苹果很酸（苹果酸），把他酸哭了，他的眼泪落到草地上，草地也变酸了（草酰乙酸）。第二年，这片变酸的草地上长出了一个很酸很酸的柠檬&lt;br /&gt;
&lt;br /&gt;
（出处未知，同学给我讲的，如果有大佬知道出处麻烦帮忙标一下）&lt;br /&gt;
&lt;br /&gt;
4.草酰乙酰成柠檬，柠檬又成α-酮，琥酰琥酸延胡索，苹果落在草丛中[[文件:嘧啶环.png|缩略图|201x201像素]]&lt;br /&gt;
&lt;br /&gt;
===== 嘧啶环原子来源 =====&lt;br /&gt;
三姑哀叹四天（3N谷氨酰胺，2C源CO&amp;lt;sub&amp;gt;2&amp;lt;/sub&amp;gt;，其余四原子（1N，4C，5C，6C）天冬氨酸&lt;br /&gt;
&lt;br /&gt;
二探三姑分四天[[文件:嘌呤环各个原子的来源.jpg|缩略图|332x332像素]]&lt;br /&gt;
&lt;br /&gt;
===== 嘌呤环原子来源 =====&lt;br /&gt;
# 一个月一天课，二十八天是假，六探亲朋好友，三舅送来鲜骨，五四旗杆挥舞。&amp;lt;br&amp;gt;1C天冬氨酸，2C,8C源N&amp;lt;sup&amp;gt;10&amp;lt;/sup&amp;gt;甲酰四氢叶酸，6C二氧化碳，3N,9N谷氨酰胺，5C,4C,7N甘氨酸&lt;br /&gt;
# 三九谷氨二八甲酸，四五七甘一天六碳&lt;br /&gt;
# 附一个结构记忆法（见右图）：谷氨酰胺的两个N原子在结构式的最下面，可以联想记忆为“谷子”长在地里；天冬氨酸的N在六元环偏上面的位置，正好与「天」字对应；两个一碳单位提供最左边与最右边的碳原子，理解为「左右护法」；剩下的即为甘氨酸的原子。&lt;br /&gt;
# 三舅姑一天六探，假二爸四五七也干（39：谷氨酰胺，1：天冬氨酸，6：CO&amp;lt;sub&amp;gt;2&amp;lt;/sub&amp;gt;，28：N&amp;lt;sup&amp;gt;10&amp;lt;/sup&amp;gt;甲酰四氢叶酸，457：甘氨酸）&lt;br /&gt;
&lt;br /&gt;
===== 氨基酸生糖/生酮 =====&lt;br /&gt;
* &#039;&#039;&#039;生酮氨基酸&#039;&#039;&#039;“L”oo“K”  酮亮赖&lt;br /&gt;
&lt;br /&gt;
* &#039;&#039;&#039;生糖兼生酮氨基酸&#039;&#039;&#039; “一本色书辣”，异亮氨酸，苯丙氨酸，色氨酸，苏氨酸，酪氨酸（杨sir发音系统）/“一本老色书”&lt;br /&gt;
&lt;br /&gt;
==== 分子生物学 ====&lt;br /&gt;
&lt;br /&gt;
===== 摆动法则 =====&lt;br /&gt;
版本一：I配对ACU（G哥不配！G哥配U！）&lt;br /&gt;
&lt;br /&gt;
I always see you联想视件👁👁，G哥也要CU~&lt;br /&gt;
&lt;br /&gt;
版本二：估计（GU、GI）第三位可GU配对，I可与除G以外的配对&lt;br /&gt;
&lt;br /&gt;
===== 蛋白质N端的第一个氨基酸 =====&lt;br /&gt;
法1：代表蛋白质稳定的：&lt;br /&gt;
    甲脯苏缬，【甲辅书写】&lt;br /&gt;
    丙半甘丝。【丙拌干丝】&lt;br /&gt;
   【记忆方法：家庭（蛋白质）“稳定”榜No.1（N端第1个AA）的，就是一个家长辅导书写（学习），另一个家长做饭（拌干丝），真是幸福的场景啊…】&lt;br /&gt;
夹丝酥饼携半甘，还有一个脯氨酸（非常好记啊）&lt;br /&gt;
&lt;br /&gt;
法2：CAMP-GST-V&lt;br /&gt;
&lt;br /&gt;
联想记忆法：露营（CAMP）时突然有人拿着商品与服务税（GST）的税单朝你比了个耶（V）&lt;br /&gt;
&lt;br /&gt;
法3：俳句记忆法&lt;br /&gt;
&lt;br /&gt;
饼（丙氨酸）上有果脯（脯氨酸）&lt;br /&gt;
&lt;br /&gt;
假（甲硫氨酸）借师（丝氨酸）叔（苏氨酸）半（半胱氨酸）张吃&lt;br /&gt;
&lt;br /&gt;
味道甘（甘氨酸）又咸（缬氨酸）&lt;br /&gt;
&lt;br /&gt;
法4：Cat maps vast gaps.（猫标注了巨大的空隙），这句话里每个字母都对应单字缩写&lt;br /&gt;
&lt;br /&gt;
===== 由 RNA PolⅡ参与转录的端粒 RNA 序列 =====&lt;br /&gt;
动真爱（动物、真菌，聚合酶Ⅱ）（自杨荣武）&lt;br /&gt;
&lt;br /&gt;
==== 由第一类氨酰tRNA合成酶催化形成氨酰tRNA的氨基酸 ====&lt;br /&gt;
姑姑（E与Q）进（R）来（K）亮（L）一亮（I）甲酪（我也不知道这什么色）色（W）鞋（V）&lt;br /&gt;
&lt;br /&gt;
=== &#039;&#039;&#039;&amp;lt;big&amp;gt;细胞生物学&amp;lt;/big&amp;gt;&#039;&#039;&#039; ===&lt;br /&gt;
&lt;br /&gt;
==== 磷脂合成位点 ====&lt;br /&gt;
甘油磷脂内质网，鞘脂高尔基。&lt;br /&gt;
&lt;br /&gt;
==== 核型分析 ====&lt;br /&gt;
AT明，CG暗；&lt;br /&gt;
&lt;br /&gt;
G带向Q看，R带叫反带；&lt;br /&gt;
&lt;br /&gt;
C异染色T末端，N带核仁组织区&lt;br /&gt;
&lt;br /&gt;
（纯顺口无辅助记忆功能，来自一彩笔没有标注来源的远古笔记（不排除是自己编的单概率极低），如果有人知道来源请帮忙署上）&lt;br /&gt;
&lt;br /&gt;
==== &#039;&#039;&#039;核糖体RNA沉降系数&#039;&#039;&#039; ====&lt;br /&gt;
原核生物（大肠杆菌）：我/爱扇/石榴（5，23，16：前两个是大亚基rna，第三个是小亚基rna）&lt;br /&gt;
&lt;br /&gt;
叶绿体：就是在原核的大亚基rna中加了一个4.5~4.8&lt;br /&gt;
&lt;br /&gt;
哺乳动物线粒体：大6小2（大亚基rna16，小亚基rna12）&lt;br /&gt;
&lt;br /&gt;
真核生物：我爸是恶霸，扇我一巴掌（5.8,28,5,18;前三个是大亚基rna，第四个是小亚基rna)——&#039;&#039;&#039;缅怀刘不言老师&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==== 核小体的结构 ====&lt;br /&gt;
直径11，高是6（单位nm），&amp;lt;u&amp;gt;146bp，1.75圈（核心组蛋白）&amp;lt;/u&amp;gt;，20的门槛，60的带（加和约200bp）&lt;br /&gt;
&lt;br /&gt;
==== 炎症Caspase ====&lt;br /&gt;
1145121（炎症Caspase有11/4/5/12/1共五种）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;起始caspase&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
28910&lt;br /&gt;
&lt;br /&gt;
== 第二部分 ==&lt;br /&gt;
&lt;br /&gt;
===&#039;&#039;&#039;&amp;lt;big&amp;gt;植物学&amp;lt;/big&amp;gt;&#039;&#039;&#039;===&lt;br /&gt;
&lt;br /&gt;
==== 植物形态解剖 ====&lt;br /&gt;
&lt;br /&gt;
===== &#039;&#039;&#039;有节乳汁管&#039;&#039;&#039; =====&lt;br /&gt;
罂粟菊旋花，芭蕉番木瓜。&lt;br /&gt;
&lt;br /&gt;
===== &#039;&#039;&#039;内生菌根&#039;&#039;&#039; =====&lt;br /&gt;
杜鹃花胡桃，桑兰李葡萄。&lt;br /&gt;
&lt;br /&gt;
===== &#039;&#039;&#039;种子与胚乳的羁绊&#039;&#039;&#039; =====&lt;br /&gt;
1.双子叶植物但是有胚乳种子：木兰田菁枣柿苋，桑戟胡茄荞麦莲。【木兰科、田菁（豆科）、&amp;lt;big&amp;gt;&#039;&#039;&#039;黑枣（柿科）&#039;&#039;&#039;&amp;lt;/big&amp;gt;、柿（柿科）、苋菜（苋科）、桑（桑科）、戟（大戟科）、胡萝卜（伞形科）、茄科、荞麦（蓼科）、莲（莲科）】&lt;br /&gt;
&lt;br /&gt;
记忆方法：木兰和田菁寻找（枣）视线，看见了桑戟（一个人名）吹着胡笳（jia），身边有荞麦和莲花。&lt;br /&gt;
&lt;br /&gt;
2.姜石甜睡胡椒外，（“僵尸”“酣hān睡”（这是故意读错的），即姜、石竹、甜菜、睡莲、胡椒是外胚乳种子，其中姜和胡椒是内外胚乳并存的）&lt;br /&gt;
&lt;br /&gt;
兰菱川苔不发生。（兰陵王和川台什么事情都没有发生，即兰科、菱科、川苔草科的种子胚乳不发生）&lt;br /&gt;
&lt;br /&gt;
慈泻眼菜无胚乳，（辞谢，即慈姑、泽泻、眼子菜是无胚乳种子）&lt;br /&gt;
&lt;br /&gt;
单有双无大多数。（其他大多数的单子叶植物种子有胚乳，双子叶植物种子无胚乳）&lt;br /&gt;
&lt;br /&gt;
===== &#039;&#039;&#039;周木维管束&#039;&#039;&#039; =====&lt;br /&gt;
# 祖母杀娼——怨啊！（周木：莎草「值得一提的是念suo’cao」 、菖蒲、鸢尾）&lt;br /&gt;
# 灵仆怨杀了胡椒。（铃蒲鸢莎蓼胡椒，即铃兰、香蒲、鸢尾、莎草、蓼科的一些植物和胡椒科的一些植物是周木维管束）&lt;br /&gt;
&lt;br /&gt;
===== &#039;&#039;&#039;气孔类型&#039;&#039;&#039; =====&lt;br /&gt;
西无景布，江平石横。（西瓜无规则，景天不等，豇「值得一提的是念jiang」豆平列，石竹横列）西边没有了景布将军的把守，战败后江水平静碎石横七竖八。&lt;br /&gt;
&lt;br /&gt;
无规瓜毛茛（错读为geng四声的话押韵），景十字不等，平列蝶茜草，石竹横直角。&lt;br /&gt;
&lt;br /&gt;
==== 植物分类学 ====&lt;br /&gt;
&lt;br /&gt;
===== &#039;&#039;&#039;藻类叶绿素&#039;&#039;&#039; =====&lt;br /&gt;
绿裸褐硅红，BBCCD。轮到原绿裸体，露出*来。（对不起，但是这对我而言雀食好记）&lt;br /&gt;
&lt;br /&gt;
（蓝：a）（轮/绿/原绿/裸：ab）（杂七杂八：ac）（红藻：ad）&lt;br /&gt;
&lt;br /&gt;
===== &#039;&#039;&#039;减数分裂&#039;&#039;&#039; =====&lt;br /&gt;
衣合刺配石莼同，硅配紫异多管同。海带异型网地同，鹿角配子减数终。&lt;br /&gt;
&lt;br /&gt;
（注释与记忆方法：第一句都是绿藻：衣合，音“伊核（协议）”，衣藻行合子减数分裂；刺配，指刺松藻等行配子减数分裂；石莼同，音“是纯铜”或者“是纯同”，即石莼行同型世代交替的孢子减数分裂。硅配，音“规培”，硅藻行配子减数分裂；红藻之中：紫异，音“自缢”，紫菜行异型世代交替的孢子减数分裂；多管同，多管藻等行同型世代交替的孢子减数分裂。剩下3个都是褐藻，海带行异型世代交替的孢子减数分裂，网地藻行同型世代交替的孢子减数分裂，鹿角菜行配子减数分裂）&lt;br /&gt;
&lt;br /&gt;
===== 合子减数分裂 =====&lt;br /&gt;
一团合子撕水轮（衣 团藻 丝藻 水绵 轮藻）&lt;br /&gt;
&lt;br /&gt;
===== 配子减数分裂 =====&lt;br /&gt;
撸管不戴小雨伞，硅胶娃娃双马尾&lt;br /&gt;
&lt;br /&gt;
🦌管硅伞送🐎（鹿藻 管藻 硅藻 伞藻 松藻 马尾藻）（这个感觉不太好 欢迎改进）&lt;br /&gt;
&lt;br /&gt;
关山归路马尾松（管伞硅鹿马尾松）&lt;br /&gt;
&lt;br /&gt;
贵马尾松散管撸（硅马尾松伞管鹿）（我记得有地方方言有“管+动词”的说法，大概是尽情去做的意思，也有点展现大气的意味…）&lt;br /&gt;
&lt;br /&gt;
===== 孢子异形 =====&lt;br /&gt;
卷满一瓶槐水（卷柏、满江红、萍、槐叶萍、水韭）&lt;br /&gt;
&lt;br /&gt;
===== &#039;&#039;&#039;子房上位&#039;&#039;&#039; =====&lt;br /&gt;
芸香石竹茄木兰，木犀蔷薇豆天南。锦葵泽泻唇毛茛，十字百合上禾本。&lt;br /&gt;
&lt;br /&gt;
（子房上位的科：芸香科、石竹科、茄科、木兰科、木犀科、蔷薇科除了梨亚科、豆科、天南星科、锦葵科、泽泻科、唇形科、毛茛科、十字花科、百合科、禾本科）&lt;br /&gt;
&lt;br /&gt;
===== &#039;&#039;&#039;子房下位&#039;&#039;&#039; =====&lt;br /&gt;
壳斗梨葫芦，伞形兰下菊。（子房下位的科：壳斗科、梨亚科、葫芦科、伞形科、兰科、菊科）&lt;br /&gt;
&lt;br /&gt;
===== &#039;&#039;&#039;中轴胎座&#039;&#039;&#039; =====&lt;br /&gt;
山毛榉姜苹，芸锦茄百合。（山毛榉科（壳斗科）、姜属、蔷薇科原苹果亚科、芸香科、锦葵科、茄科、百合科）&lt;br /&gt;
&lt;br /&gt;
===== &#039;&#039;&#039;假二叉分枝&#039;&#039;&#039; =====&lt;br /&gt;
假槲竹香。（槲寄生、石竹、丁香）&lt;br /&gt;
&lt;br /&gt;
===== 花程式记忆 =====&lt;br /&gt;
K萼C冠P花被，A雄G雌线表位&lt;br /&gt;
&lt;br /&gt;
====唇形科====&lt;br /&gt;
方茎对叶油挥发，轮伞花序唇形花&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
菩萨蛮·唇形科&lt;br /&gt;
&lt;br /&gt;
藿香薄荷薰衣草，罗勒丹参一串红。&lt;br /&gt;
&lt;br /&gt;
鼠尾益母草，迷迭百里香。（剩下四句编不进去了摆了）&lt;br /&gt;
&lt;br /&gt;
===== &#039;&#039;&#039;百合是同被花&#039;&#039;&#039; =====&lt;br /&gt;
因为百合是同，三数五轮，子房上位。&lt;br /&gt;
&lt;br /&gt;
===== 被子植物分类 =====&lt;br /&gt;
来自质心教育。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;柿树科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
单叶全缘常互生，雌雄常异花单性。宿存花萼果期大，花冠旋转3-7。&lt;br /&gt;
&lt;br /&gt;
雄蕊基生倍数生，子房上位有多室。浆果种子有薄皮，柿与君迁味道鲜。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;木犀科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
木本植物对生叶，两性花冠无托叶。圆锥聚伞顶或腋，花萼花冠常4裂。&lt;br /&gt;
&lt;br /&gt;
雄蕊2枚常下位，两个心皮房上位。浆核翅蒴种类多，观赏绿化用此科。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;马钱科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
两性整齐为单叶，花序多歧再排列。花萼花冠45裂，冠生雄蕊常内藏。&lt;br /&gt;
&lt;br /&gt;
子房上位常2室，蒴果浆果核果生。醉鱼草多香美丽，观赏栽培作药行。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;夹竹桃科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
草木藤本多年生，乳汁水液遍全身。草叶全缘对或轮，托叶常退脉羽状。&lt;br /&gt;
&lt;br /&gt;
大花两性形整齐，萼常5裂冠合瓣。花冠喉部有附属，5枚雄蕊生于上。&lt;br /&gt;
&lt;br /&gt;
子房上位心皮2，浆核朔果蓇葖果。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;萝藦科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
草本藤本常攀援，块根肉质乳汁粘。单叶全缘脉羽状，聚伞花序成伞状。&lt;br /&gt;
&lt;br /&gt;
花冠合瓣檐5裂，雌雄粘生合蕊柱。子房上位2心皮，侧膜胎座蓇葖果。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;旋花科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
缠绕匍匐草质藤，常有乳汁叶互生。叶形多样花生腋，梗细常有2苞片。&lt;br /&gt;
&lt;br /&gt;
冠生雄蕊有5枚，漏斗花冠相互生。中轴胎座两胚珠，子房上位蒴果成。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;花荵科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
互生对生常草本，两性花为5基数。花冠辐状或筒状，雄蕊5枚冠筒上。&lt;br /&gt;
&lt;br /&gt;
花盘环状常5裂，子房上位心皮变。中轴胎座成蒴果，中华花荵绿化多。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;紫草科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
草本植物被硬毛，单叶互生多粗糙。单歧蝎尾聚散序，5枚雄蕊冠上找。&lt;br /&gt;
&lt;br /&gt;
花萼5枚冠5瓣，喉部常有附属物。两个心皮4深裂，复雌蕊生4坚果。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;马鞭草科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
单叶对生茎具棱，常无托叶叶对生。花序穗状或聚伞，花萼杯状果宿存。&lt;br /&gt;
&lt;br /&gt;
花冠合生45裂，雄蕊4枚为二强。子房上位两心皮，坚果成熟才分离。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;唇形科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
茎四棱，叶对生，挥发油脂遍全身。轮伞花序唇形冠，2强雄蕊高处站。&lt;br /&gt;
&lt;br /&gt;
子房上位2心合，留下4个小坚果。薄荷藿香与荆芥，益母黄芩可活血。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;茄科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
双韧维管叶互生，聚伞花序叶腋成。合瓣花冠常成筒，雄蕊5枚相互生。&lt;br /&gt;
&lt;br /&gt;
中轴胎座两心皮，每室多胚果实生。浆果常可作蔬菜，烟草常用蒴果栽。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;玄参科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
草多稀有树木生，单叶多为相对生。两性花成各花序，萼片宿存冠合生。&lt;br /&gt;
&lt;br /&gt;
二唇裂片4-5，二强雄蕊冠筒生。子房上位有2室，中轴胎座蒴果成。&lt;br /&gt;
&lt;br /&gt;
唇形与之多相似，茎圆而非四方棱。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;紫葳科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
乔木灌木稀草本，单叶复叶稀互生。两性花大多美丽，左右对称多花序。&lt;br /&gt;
&lt;br /&gt;
雄蕊5枚生冠基，裂片互生1不育。子房位于花盘上，1至2室多胚珠。&lt;br /&gt;
&lt;br /&gt;
家种梓树与楸树，凌霄攀上是大户。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;胡麻科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
草本多为叶对生，两侧对称花两性。单生叶腋顶生序，花冠筒状稍似唇。&lt;br /&gt;
&lt;br /&gt;
雄蕊4枚花互生，花盘杯状房上位。中轴胎座花柱1，蒴果坚果核果状。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;车前科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
草本单叶常基生，基部呈鞘脉近平。穗状花序有两性，花冠膜质花小型。&lt;br /&gt;
&lt;br /&gt;
雄蕊4枚冠筒内，子房上位蒴果坐。全草是宝药效好，叶似辐条容易找。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;茜草科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
单叶对生或轮生，两片托叶柄基生。花多两性辐射称，45基数样式多。&lt;br /&gt;
&lt;br /&gt;
雄蕊花冠相互生，子房下位常2室。蒴果核果和浆果，胚珠多数至1枚。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;忍冬科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
灌木缠绕或直立，本质柔软大髓心。对生叶来无托叶，两性花称聚簇生。&lt;br /&gt;
&lt;br /&gt;
花筒子房基处合，雄蕊4-5与互生。子房下位浆核果，药用观赏价值多。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;败酱科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
常见草本多年生，叶片对生或基生。羽状分裂或全缘，花小两性无托叶。&lt;br /&gt;
&lt;br /&gt;
花序聚伞圆锥状，花萼小而不明显。花冠筒状微具距，雄蕊3枚或4枚。&lt;br /&gt;
&lt;br /&gt;
子房下位有3室，仅有1室可发育。果实常见为蒴果，先端增大形成翅。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;葫芦科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
藤本植物草本质，侧生卷须可攀援。单叶互生掌状裂，雌雄同异花单性。&lt;br /&gt;
&lt;br /&gt;
花萼5裂花冠合，雄蕊5枚药常曲。子房下位3侧膜，柱头3个胚珠多。&lt;br /&gt;
&lt;br /&gt;
瓠果内质种子多，东西南北瓜水果。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;桔梗科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
多为草本稀木本，直立攀援汁液多。常单叶生无托叶，聚伞花序单二歧。&lt;br /&gt;
&lt;br /&gt;
两性花常相对称，萼筒子房相合生。花冠5裂样式多，雄蕊同数基处着。&lt;br /&gt;
&lt;br /&gt;
子房下位半下位，中轴胎座蒴果成。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;菊科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
此乃被子第一科，分布极广用极多。头状花序有总苞，舌花管花萼变毛。&lt;br /&gt;
&lt;br /&gt;
5枚雄蕊常合生，紧抱一起称聚药。下位子房珠室1，瘦果有毛随风跑。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;禾本科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
此科常有禾与竹，农工绿化功勋著。秆空有节基分枝，单叶互生成两列。&lt;br /&gt;
&lt;br /&gt;
叶鞘舌耳有或缺，脉纵平行好分别。两性花小装小穗，颖包稃片裹浆片。&lt;br /&gt;
&lt;br /&gt;
雄蕊常3药丁字，子房上位一珠室。颖果常作粮食用，稻麦黍粟见四处。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;莎草科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
草本常有根状茎，地上无节三棱形。叶有三列茎实心，或仅叶鞘闭合生。&lt;br /&gt;
&lt;br /&gt;
各种花序或小穗，毛鳞常见花被退。雄蕊常3雌蕊复，子房上位1珠室。&lt;br /&gt;
&lt;br /&gt;
坚果三棱凸球形，荸荠香附作药行。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;棕榈科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
木本茎直主干明，叶基宿存常抱茎。鞘片纤维用处广，棕垫棕绳与棕箱。&lt;br /&gt;
&lt;br /&gt;
叶似圆扁簇生顶，掌状分裂皱褶长。花序常为圆锥状，花小整齐性难分。&lt;br /&gt;
&lt;br /&gt;
6片花被6雄蕊，两轮排列单雌蕊。子房上位多3室，浆果核果长圆状。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;天南星科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
草本常有球根茎，体含乳汁气生根，茎基常有膜质鞘，叶形叶脉样式多。&lt;br /&gt;
&lt;br /&gt;
肉穗花序佛焰苞，宿存早落色彩耀。花小味臭性难分，雄蕊稀1248，&lt;br /&gt;
&lt;br /&gt;
雌蕊1枚心室多，浆果密集穗轴生。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;鸭趾草科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
多汁草本直或攀，柄基膜质鞘抱茎。互生单叶并行脉，辐射对称花两性。&lt;br /&gt;
&lt;br /&gt;
花被2轮外宿存，6枚雄蕊或2退。两个药室并或叉，1个雌蕊房上位。&lt;br /&gt;
&lt;br /&gt;
中轴胎座或蒴果，种子有棱胚盖圆。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;雨久花科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
多年草本水边生，根状茎粗或横走。地上茎短叶鞘包，辐射对称花两性。&lt;br /&gt;
&lt;br /&gt;
6片花被覆瓦状，6枚雄蕊缺或退。雌蕊1枚房上位，3室中轴1侧膜。&lt;br /&gt;
&lt;br /&gt;
果实有分蒴和胞，常见凤眼鸭舌草。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;百合科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
多年草本稀木本，基生单叶基互生。辐射对称花两性，6枚花被两轮生。&lt;br /&gt;
&lt;br /&gt;
同数雄蕊与花对，子房大多安上位。3室子房中轴座，心皮3数雌蕊复。&lt;br /&gt;
&lt;br /&gt;
茎大花美蒴果浆，葱蒜百合郁金香。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;石蒜科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
鳞茎根茎多年生，线形带状叶基生。伞形花序合两性，常有总苞成膜状。&lt;br /&gt;
&lt;br /&gt;
花被6枚如花瓣，雄蕊6枚两轮转。3个心皮如百合，子房却在下位安。&lt;br /&gt;
&lt;br /&gt;
美丽清香用处广，水仙石蒜君子兰。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;薯蓣科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
攀援缠绕多年生，块茎肉质常似根。叶常互生稀为对，基部心形掌脉明。&lt;br /&gt;
&lt;br /&gt;
叶柄关节常扭转，雌雄异株花单性。花被6片列两轮，雄蕊6枚或3退。&lt;br /&gt;
&lt;br /&gt;
子房下位有3室，蒴果3瓣有3翅。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;鸢尾科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
多年草本茎多样，长叶基生套折状。两性对称两轮生，花被皆为花瓣相。&lt;br /&gt;
&lt;br /&gt;
雄蕊3枚基处生，柱头3裂似花瓣。子房下位3心皮，胎座3室中轴长。&lt;br /&gt;
&lt;br /&gt;
蒴果背裂易种植，药用观赏皆为上。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;芭蕉科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型草本树模样，鞘状叶柄茎包上。互生大叶羽脉长，花序穗状圆锥状。&lt;br /&gt;
&lt;br /&gt;
两性单性皆存在，6被2轮不整齐。雄蕊6枚或缺1，下位子房3室生。&lt;br /&gt;
&lt;br /&gt;
丝状柱头常3个，长形浆果为水果。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;姜科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
多年草本清香气，根茎球茎单生茎。单叶有鞘叶舌在，椭叶线形羽状脉。&lt;br /&gt;
&lt;br /&gt;
花序总状或单生，两性花来左右称。花被6枚两轮生，雄蕊1育2退去。&lt;br /&gt;
&lt;br /&gt;
子房下位有3室，中轴胎座蒴果成。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;美人蕉科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
粗大芽本多年生，根茎块状叶大型。羽状叶脉中脉起，鞘状抱茎无叶舌。&lt;br /&gt;
&lt;br /&gt;
两性花艳不整齐，两轮花被共6枚。6枚雄蕊如花瓣，也生两轮有重瓣。&lt;br /&gt;
&lt;br /&gt;
子房下位有3室，蒴果具疣种细微。&lt;br /&gt;
=== &#039;&#039;&#039;&amp;lt;big&amp;gt;植物生理学&amp;lt;/big&amp;gt;&#039;&#039;&#039; ===&lt;br /&gt;
&lt;br /&gt;
==== 植物细胞、水分与矿质生理 ====&lt;br /&gt;
&lt;br /&gt;
==== 植物代谢 ====&lt;br /&gt;
&lt;br /&gt;
==== 植物生长发育 ====&lt;br /&gt;
&#039;&#039;&#039;&#039;&#039;植物光周期反应类型&#039;&#039;&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;LDP（日照长于14~17h)&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
小麦大麦和黑麦&lt;br /&gt;
&lt;br /&gt;
油菜菠菜卷心菜&lt;br /&gt;
&lt;br /&gt;
萝卜（＆胡萝卜）芹菜各所爱&lt;br /&gt;
&lt;br /&gt;
天仙只吃甜白菜（甜菜＆白菜）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;SDP（日照短于12小时，大于8小时）&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
C4植物（玉米，甘蔗，高粱）水菊棉&lt;br /&gt;
&lt;br /&gt;
大豆吸麻（大麻＆黄麻）肺冒烟（烟草）&lt;br /&gt;
&lt;br /&gt;
苍耳紫苏小草莓&lt;br /&gt;
&lt;br /&gt;
海棠牵牛赏腊梅&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;DNP&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
茄科四黄人（茄子，番茄，辣椒，四季豆，黄瓜）&lt;br /&gt;
&lt;br /&gt;
蒲公向日眠（蒲公英，向日葵）&lt;br /&gt;
&lt;br /&gt;
君子煮菜豆（君子兰，菜豆）&lt;br /&gt;
&lt;br /&gt;
香飘月季田（月季）&lt;br /&gt;
&lt;br /&gt;
===== 七律·光周期 =====&lt;br /&gt;
麦菜仙子十字花，甘蓝洋葱伞形长。禾本大豆管状花，棉麻紫牛烟草短。&lt;br /&gt;
&lt;br /&gt;
黄瓜茄科日中性，四季菜豆蒲公英。大叶芦荟长短日，叶茅风铃短长日。&lt;br /&gt;
&lt;br /&gt;
（长日照植物：大/小/黑/燕麦、菠/甜菜、天仙子、十字花（萝卜、芹菜、油菜、拟南芥）、甘蓝、洋葱、伞形科（芹菜、胡萝卜））&lt;br /&gt;
&lt;br /&gt;
（短日照植物：禾本（晚稻、水稻、高粱、甘蔗）、大豆、管状花（菊花、苍耳）、棉花、大麻、黄麻、紫苏、日本牵牛、烟草）&lt;br /&gt;
&lt;br /&gt;
（日中性植物：黄瓜、茄科（茄子、辣椒、番茄）、四季豆、菜豆、蒲公英）&lt;br /&gt;
&lt;br /&gt;
（长短日植物：大叶落地生根、芦荟）（短长日植物：白三叶草、鸭茅、风铃草）&lt;br /&gt;
&lt;br /&gt;
（综合了王小菁、李合生，有矛盾的点以王小菁为主。李合生、武维华：甘蔗是中日性植物）&lt;br /&gt;
&lt;br /&gt;
===== &#039;&#039;&#039;长日照、短日照、日中性植物&#039;&#039;&#039; =====&lt;br /&gt;
长菠甜油麦，胡芹萝仙白。（长日照植物：菠菜、甜菜、油菜、大麦、小麦、胡萝卜、芹菜、萝卜、天仙子、白菜）&lt;br /&gt;
&lt;br /&gt;
短大苍烟腊，紫菊稻牵麻。（短日照植物：大豆、苍耳、美洲烟草、腊梅、紫苏、菊科、晚稻、日本牵牛、麻类）&lt;br /&gt;
&lt;br /&gt;
日中番茄辣，季蒲茄黄瓜。（日中性植物：番茄、辣椒、四季豆、蒲公英、茄子、黄瓜）&lt;br /&gt;
&lt;br /&gt;
===== &#039;&#039;&#039;短日照植物&#039;&#039;&#039; =====&lt;br /&gt;
菊科豆烟草，玉米牵（牛花）棉稻&lt;br /&gt;
&lt;br /&gt;
===== &#039;&#039;&#039;关于引种&#039;&#039;&#039; =====&lt;br /&gt;
短男北引早（短小的男人到了北方就会引起早xie）&lt;br /&gt;
&lt;br /&gt;
（指南方短日照作物向北引种要引早熟的品种）&amp;lt;blockquote&amp;gt;（真不是我想的是我同学非让我写到osm上）&amp;lt;/blockquote&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== &#039;&#039;&#039;&amp;lt;big&amp;gt;微生物学&amp;lt;/big&amp;gt;&#039;&#039;&#039; ===&lt;br /&gt;
&lt;br /&gt;
====常见抗生素/毒素的靶标细胞和效果====&lt;br /&gt;
1.靶标细胞：&lt;br /&gt;
&lt;br /&gt;
   氯四红青卡那霉，（靶标细胞为原核细胞的）&lt;br /&gt;
   潮嘌呤和梭链孢，（靶标细胞为原核&amp;amp;真核细胞的）&lt;br /&gt;
   真核还有白放线。（靶标细胞为真核细胞的）&lt;br /&gt;
&lt;br /&gt;
2.抑制移位的【一个看了之后走不动道（抑制移位）的小故事】：&lt;br /&gt;
&lt;br /&gt;
   大灰狼戴上白假发，（白喉毒素）（于是有了2个奶奶👵🏻→抑制EF-2）&lt;br /&gt;
   在出口阻拦了小红帽，（红霉素，通过“阻挡”出口来抑制移位）&lt;br /&gt;
   猎人朝狼开了一枪，狼应声倒地，【潮霉素，无法a→p（拼音发音读出来类似up）】&lt;br /&gt;
   善良的小红帽最后放走了狼（放线菌酮），回家了（茴香霉素）&lt;br /&gt;
猎人潮了狼不就拼出来了(&lt;br /&gt;
&lt;br /&gt;
3.抑制AA-tRNA和核糖体结合的：&lt;br /&gt;
   &lt;br /&gt;
   那链四嘌呤结尾（终止）&lt;br /&gt;
   （卡那霉素，链霉素，四环素，嘌呤霉素。嘌→链终止子）&lt;br /&gt;
&lt;br /&gt;
4.其他功能：&lt;br /&gt;
   GGB用链子阻止了mRNA发动技能，【B→蓖麻毒素，抑制翻译因子GTP酶（G）活性。链→链霉素，阻止蛋白质合成正确起始（m发动技能）】&lt;br /&gt;
   mRNA自知拼尽全力无法战胜，亮出身份卡，却被误解为放狠话，【卡→卡那霉素，误解→mRNA错读】&lt;br /&gt;
   好在小青及时发现阻止其吞药暴毙。【青→青霉素，抑制胞壁（暴毙）合成，吞药→转肽】&lt;br /&gt;
5.微生物培养：恒化器与恒浊器&lt;br /&gt;
&lt;br /&gt;
恒浊内控菌密度，没有限制变流速，最高速率生产主（恒化器相反）&lt;br /&gt;
&lt;br /&gt;
==== 病毒核酸情况（自[[病毒分类整理]]） ====&lt;br /&gt;
DNA大多双链除了细小，RNA大多单链除了呼肠孤；&lt;br /&gt;
&lt;br /&gt;
负链包括“&#039;&#039;&#039;狂塞遛马爱丁汉&#039;&#039;&#039;”（狂腮流麻埃丁汉）（在狂风大作的塞外遛马的来自爱丁堡的汉子）；&lt;br /&gt;
&lt;br /&gt;
正链包括“&#039;&#039;&#039;观日几恼黄热风&#039;&#039;&#039;”（冠日脊脑黄热风）（他在观看日出时好几次因为黄热的风而感到气恼）（黄热代表了好几个黄病毒科的物种）。&lt;br /&gt;
&lt;br /&gt;
==== 原生生物 ====&lt;br /&gt;
草履虫接合生殖：&#039;&#039;&#039;&amp;lt;big&amp;gt;43128 44314&amp;lt;/big&amp;gt;&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== 第三部分 ==&lt;br /&gt;
&lt;br /&gt;
===&#039;&#039;&#039;&amp;lt;big&amp;gt;动物学&amp;lt;/big&amp;gt;&#039;&#039;&#039;===&lt;br /&gt;
&lt;br /&gt;
==== 动物的一般结构与发育 ====&lt;br /&gt;
搞定胚层来源只需要一个固搭：植食小动物（小细胞动物极内包大细胞植物极，海绵的胚胎逆转就相反）&lt;br /&gt;
&lt;br /&gt;
胚层发育大致规律：内呼消腺，中肌生排骨，外表神感。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;脊椎动物胚层发育&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;外表感神腺&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
外胚层发育：表皮，感觉器官，神经管&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;内消呼肝胰&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
内胚层发育：消化系统，呼吸系统，肝脏胰脏，（甲状腺，胸腺）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;中生循排真肌脊&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
中胚层发育：生殖系统，循环系统，泌尿系统（排泄），真皮，肌肉，脊椎。&lt;br /&gt;
&lt;br /&gt;
==== 多细胞动物的多样性 ====&lt;br /&gt;
[[丢失的五脏六腑|有关泄殖腔与泄殖窦：见动物]]&lt;br /&gt;
&lt;br /&gt;
经验规律：当生物头端朝左，无脊椎血液流向是逆时针，脊椎动物流向是顺时针。&lt;br /&gt;
&lt;br /&gt;
无脊椎动物心脏在背面，因此腹血管由前向后；脊椎动物心脏在腹面，（略）&lt;br /&gt;
&lt;br /&gt;
暴雪将来：血吸虫——二代胞蚴，布氏姜片虫——二代雷蚴&lt;br /&gt;
&lt;br /&gt;
双壳纲入水孔出水孔怎么判断：以足为腹，上出下入。水过鳃肠，入大小出。&lt;br /&gt;
&lt;br /&gt;
无齿蚌和中国圆田螺的“左”与“右”：下入上出，左入右出，右上左下（无齿蚌出水孔和入水孔位置、中国圆田螺出水孔和入水孔位置、中国圆田螺左右食道神经节位置恰好对应）&lt;br /&gt;
&lt;br /&gt;
伸缩闭三肌相对位置：闭壳外大，缩足内小，两者成对，伸足前单。&lt;br /&gt;
&lt;br /&gt;
退钱：前胸腺-蜕皮激素，保研：咽侧体-保幼激素。&lt;br /&gt;
&lt;br /&gt;
气体如何进鱼鳔？卵圆吸收红分泌。红自系膜出肝门，卵自背动出后主。&lt;br /&gt;
&lt;br /&gt;
比目鱼&amp;lt;s&amp;gt;的手性&amp;lt;/s&amp;gt;：左鲆右鲽，左舌（舌鳎）右鳎&lt;br /&gt;
&lt;br /&gt;
另：比目鱼目的扭转是单起源，向左向右随机！脸部左转（&amp;lt;s&amp;gt;L型&amp;lt;/s&amp;gt;）的类群和脸部右转（&amp;lt;s&amp;gt;D型&amp;lt;/s&amp;gt;）的类群是会产生生殖隔离的。&lt;br /&gt;
&lt;br /&gt;
攀禽：风（蜂鸟目）雨烈（䴕形目）卷（鹃形目）佛缨（鹦鹉目）&lt;br /&gt;
&lt;br /&gt;
早成鸟：䴙䴘厌（雁形目）鸡鹤恨（鸻形目 ）鸥&lt;br /&gt;
&lt;br /&gt;
（晚成鸟）鹳雀雨（雨燕）鸽隼信天（信天翁），（早成鸟）䴙䴘鸡鸥鸻鹤雁&lt;br /&gt;
&lt;br /&gt;
巢毕：毕氏器-卵巢退化&lt;br /&gt;
&lt;br /&gt;
光追“aegleseeker（不是）”：肝片吸虫-椎实螺，烯烃：血吸虫-钉螺，枣糕：华枝睾吸虫-沼螺，不卷：布氏姜片虫-扁卷螺&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;寄生虫：黑血虐狗死！中国狗，世界追！&amp;lt;s&amp;gt;（言论危险haha）&amp;lt;/s&amp;gt;&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
（黑热病是杜氏利什曼原虫，中国与世界的差异只有钩虫/锥虫）&lt;br /&gt;
&lt;br /&gt;
中国五大寄生虫：疟原虫、血吸虫、钩虫、丝虫和杜氏利什曼原虫（钩丝别吸原什了［不是］）&lt;br /&gt;
&lt;br /&gt;
寄生虫与中间寄主：钉子扎出血，睾丸找不到，于是看片追思，再也不卷了（血吸虫——钉螺，华睾——沼螺，肝片吸尘——椎实螺，布氏姜片虫——扁卷螺）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;血虐死狗屎，世界狗成锥&#039;&#039;&#039;（&#039;&#039;血吸虫，疟原虫，丝虫，钩虫，杜氏利什曼原虫，锥虫&#039;&#039;）&lt;br /&gt;
&lt;br /&gt;
世界卫生组织五大寄生虫：疟原虫、血吸虫、丝虫、杜氏利什曼原虫、锥虫。（钩虫变锥虫）（丝宅锥吸欢玩原什了）&lt;br /&gt;
&lt;br /&gt;
==== 动物地理、进化与生态 ====&lt;br /&gt;
&lt;br /&gt;
==== 昆虫激素 ====&lt;br /&gt;
蜕胸保咽侧，活脑贮心间。（本人写过最骄傲的一句）&lt;br /&gt;
&lt;br /&gt;
=== &#039;&#039;&#039;&amp;lt;big&amp;gt;生理学&amp;lt;/big&amp;gt;&#039;&#039;&#039; ===&lt;br /&gt;
&lt;br /&gt;
==== 凝血因子1-13的口诀 ====&lt;br /&gt;
&lt;br /&gt;
===== 常规顺序记忆‌ =====&lt;br /&gt;
&#039;&#039;“一纤二酶三外源，四钙五变七稳定；八抗九乙十斯图，十一前质十二触，十三稳固纤维结。”（凝血因子6被删除）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
（分别对应：I-纤维蛋白原、II-凝血酶原、III-组织因子、IV-Ca²⁺、V-易变因子、VII-稳定因子、VIII-抗血友病球蛋白、IX-血浆凝血活酶、X-Stuart因子、XI-凝血活酶前质、XII-接触因子、XIII-纤维蛋白稳定因子）‌&lt;br /&gt;
&lt;br /&gt;
===== 谐音趣味版‌ =====&lt;br /&gt;
伊人纤手（I纤），尔酿醇酒（II酶），三伏外游（III外源）；四盖钙汤（IV钙），五变身手（V变），七夕稳赢（VII稳）；八抗甲血（VIII抗甲），九姨活现（IX乙），十全斯图（X斯图）；十一前奏（XI前质），十二触媒（XII触），十三稳固（XIII稳固）。&lt;br /&gt;
&lt;br /&gt;
===== ‌外源性凝血途径‌ =====&lt;br /&gt;
&#039;&#039;“外有小三（III），妻子暴走（VII）！”&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
（外源性由III因子启动，需与VII因子结合激活FX）‌&lt;br /&gt;
&lt;br /&gt;
===== 内源性凝血途径‌ =====&lt;br /&gt;
&#039;&#039;“家内（内源性）闹矛盾：爸爸（VIII）和舅舅（IX）开战，120（XII）、110（XI）都来劝！”&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
（内源性由XII因子启动，依次激活XI→IX，需VIII因子辅助）‌&lt;br /&gt;
&lt;br /&gt;
===== 关键辅助因子与激活物‌ =====&lt;br /&gt;
&lt;br /&gt;
* ‌钙五板三成内源‌：内源性途径中，Ca²⁺（IV）、V因子、PF3（血小板磷脂）与Xa共同激活凝血酶原‌。&lt;br /&gt;
* ‌纤凝必高成单体‌：凝血酶（IIa）催化纤维蛋白原（I）→纤维蛋白单体，XIII因子加固纤维蛋白网‌&lt;br /&gt;
* 需要维生素K的凝血因子：儿(II)妻(VII)就(IX)是(X)大王&#039;&#039;&#039;(K)&#039;&#039;&#039;的依靠&lt;br /&gt;
&lt;br /&gt;
==== 神经系统的功能 ====&lt;br /&gt;
&lt;br /&gt;
===== 脑神经口诀 =====&lt;br /&gt;
版本一：一嗅二视三动眼，四滑五叉六外展。七面八听九舌咽，迷副舌下神经全。&lt;br /&gt;
&lt;br /&gt;
版本二：一嗅二视三动眼，四滑五叉六外展。七面八听九舌咽，十迷一副舌下全。&lt;br /&gt;
&lt;br /&gt;
===== 脑神经的性质 =====&lt;br /&gt;
一二八对性质感，运动舌副动滑展。舌咽迷走三叉面，感觉运动混合全。&lt;br /&gt;
&lt;br /&gt;
（1、2、8：感觉）（3、4、6、11、12：运动）（5、7、9、10：运动+感觉）&lt;br /&gt;
&lt;br /&gt;
感觉神经128，动346副舌下，579 10 为混杂。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
===== 神经胶质细胞形成髓鞘 =====&lt;br /&gt;
&lt;br /&gt;
中突外湿（有点硬当）&lt;br /&gt;
&lt;br /&gt;
===== 心音时期（图像记忆） =====&lt;br /&gt;
[[文件:心音.jpg|缩略图]]&lt;br /&gt;
（如图）（同上）&lt;br /&gt;
&lt;br /&gt;
=====促离子型受体=====&lt;br /&gt;
&lt;br /&gt;
123ACG，咕不咕（X&lt;br /&gt;
&lt;br /&gt;
【翻译：ACh的N1、N2，5-HT的3，GABA的A和C，Gly所有受体，Glu的受体中名字里不带Glu的（即NMDA、AMPA、KA），ATP的P2X】&lt;br /&gt;
&lt;br /&gt;
=== 生态学 ===&lt;br /&gt;
&lt;br /&gt;
==== 生物与环境 ====&lt;br /&gt;
&lt;br /&gt;
==== 种群生态学 ====&lt;br /&gt;
&lt;br /&gt;
==== 群落生态学 ====&lt;br /&gt;
&lt;br /&gt;
==== 生态系统生态学 ====&lt;br /&gt;
&lt;br /&gt;
==== 应用与现代生态学 ====&lt;br /&gt;
&lt;br /&gt;
=== &#039;&#039;&#039;&amp;lt;big&amp;gt;动物行为学&amp;lt;/big&amp;gt;&#039;&#039;&#039; ===&lt;br /&gt;
&lt;br /&gt;
===== 研究方法与一般行为 =====&lt;br /&gt;
&lt;br /&gt;
==== 行为遗传、进化、生理、发育 ====&lt;br /&gt;
&lt;br /&gt;
==== 动物的特殊行为 ====&lt;br /&gt;
&lt;br /&gt;
===== 阿朔夫规律 =====&lt;br /&gt;
夜夜短日长（夜行性动物在长夜下周期变短，长日下变长，日行性相反）（他人补充：我自己用的口诀是“同短异长”）&lt;br /&gt;
&lt;br /&gt;
比较理解性（？）夜行性动物恒黑下昼夜节律缩短，类似你打游戏的时候感觉时间过得很快（爽嘛），昼行性同理。&lt;br /&gt;
&lt;br /&gt;
===== 不同传粉者对应的花特征 =====&lt;br /&gt;
蜂爱甜香紫外光，蝶恋艳色管底藏；蛾趁月白送夜香，鸟啄红艳无芬芳；&lt;br /&gt;
&lt;br /&gt;
蝙蝠撞钟酸腐尝，甲虫爬碗啃花粮；苍蝇掉进臭肉房，风媒水媒简装潢。&lt;br /&gt;
&lt;br /&gt;
== 第四部分 ==&lt;br /&gt;
&lt;br /&gt;
=== 遗传学 ===&lt;br /&gt;
&lt;br /&gt;
=== 演化生物学 ===&lt;br /&gt;
分类阶元的英文首字母:&#039;&#039;&#039;KPCOFGS&#039;&#039;&#039;  &amp;lt;s&amp;gt;快瓢昌我放过哨&amp;lt;/s&amp;gt;&lt;br /&gt;
&lt;br /&gt;
(King Philip Came Over For Good Sex)&lt;br /&gt;
&lt;br /&gt;
=== 生物信息学 ===&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E6%B5%81%E6%98%9F%E4%B8%8B%E7%9A%84%E8%AE%B8%E6%84%BF%E5%A2%99&amp;diff=6969</id>
		<title>流星下的许愿墙</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E6%B5%81%E6%98%9F%E4%B8%8B%E7%9A%84%E8%AE%B8%E6%84%BF%E5%A2%99&amp;diff=6969"/>
		<updated>2025-05-07T08:38:08Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* 许愿墙 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= &#039;&#039;&#039;祝每个梦想都能实现，今年，国赛见！&#039;&#039;&#039; =&lt;br /&gt;
&lt;br /&gt;
= 许愿墙 =&lt;br /&gt;
希望今年可以进省队，进必还愿。——2025.5.5日luphut&lt;br /&gt;
&lt;br /&gt;
我也想进队😭   ----2025.5.5tftz&lt;br /&gt;
&lt;br /&gt;
调色板别炒9nine冷饭了，感紧出新作。 ----2025.5.5tftz&lt;br /&gt;
&lt;br /&gt;
我明年想进省队----2025.5.5报告基因FJX&lt;br /&gt;
&lt;br /&gt;
希望今年可以进省队——2025.5.5 hukk&lt;br /&gt;
&lt;br /&gt;
希望稳进浙江省队，也祝我们夺得11个省队名额！——2025.5.5晚 C.C.&lt;br /&gt;
&lt;br /&gt;
有点想进队呢——2025.5.6 文弋&lt;br /&gt;
&lt;br /&gt;
许愿省队(ง •̀_•́)ง——2025.5.6 神秘的炒饭&lt;br /&gt;
&lt;br /&gt;
许愿自己以及同校的大家尽量多地进省队！^ ^&amp;lt;small&amp;gt;（以及祝我抽卡顺利（）&amp;lt;/small&amp;gt;——2025.5.6 W. Machine&lt;br /&gt;
&lt;br /&gt;
许愿能进省队，朝向梦想进发，球球啦——2025.5.6 MangoCat&lt;br /&gt;
&lt;br /&gt;
希望今年稳进省队！！！进必还愿。——2025.5.6 Xswl&lt;br /&gt;
&lt;br /&gt;
许愿自己和身边的大家都可以多多进省队^_^———2025.5.6 Okazaki3333&lt;br /&gt;
&lt;br /&gt;
&amp;lt;nowiki&amp;gt;🙏🏼——2025.5.6 --[[用户:Tsusha|Tsusha]]（[[用户讨论:Tsusha|留言]]） 2025年5月6日 (二) 20:29 (CST)&lt;br /&gt;
&lt;br /&gt;
希望今年自己及身边的蒟蒻都进省队！明年开始冲击化学(๑•̀ㅂ•́)و✧   国家集训队50个，我只要一个   —— 磷酸丙糖异构酶 2025.5.6 FYJ&lt;br /&gt;
&lt;br /&gt;
肯定希望进省队啊，也是想给自己一个交代，不负自己的期待，故在此立志，等我一周后来还愿——神秘的偷马头 2025.5.6 YXH&lt;br /&gt;
&lt;br /&gt;
&amp;lt;nowiki&amp;gt;希望今年一定进省队，球球啦--[[用户:羊驼洋子|羊驼洋子]]（[[用户讨论:羊驼洋子|留言]]） 2025年5月6日 (二) 19:50 (CST)&lt;br /&gt;
&lt;br /&gt;
当然是想进省队啦，虽然我不信什么许愿的吧，但还是把目标写下来比较好喵～———Redemption 2025.5.6 20:20&lt;br /&gt;
&lt;br /&gt;
许愿省队~~希望可以向我喜欢的人更靠近一步~~     ————WangBoDe  2025.5.6  20:25&lt;br /&gt;
&lt;br /&gt;
许愿捞个省三以上的奖项，这样明年就可以继续和大家一起学生物竞赛(´∀｀)♡    ————竹下。2025.5.6  21:20&lt;br /&gt;
&lt;br /&gt;
稳一（冲省），不辜负。——曾一航。2025.5.6&lt;br /&gt;
&lt;br /&gt;
陕西省队🙏🏻🙏🏻🙏🏻希望结果配得上我所受痛苦——单位捕捞努力的三倍体2025.5.6&lt;br /&gt;
&lt;br /&gt;
希望今年我和身边的朋友能多多进省队，不负这场盛夏！！！——Ywxm 2025.5.7 00:15&lt;br /&gt;
&lt;br /&gt;
想成为一只优秀的小猫。考省一最好，当然也有省队梦，虽然有点难度，但是只要把过程做好了，一定有个结果等着我！也希望身边优秀的同学们能一起进队，考出自己最好的成绩—— 加猫酶 Catting enzyme  2025.5.7 XYQ&lt;br /&gt;
&lt;br /&gt;
希望雪豹可以今年进省一，明年进省队！（知道雪豹是什么东西的一定认出来这东西的来历了，那么朋友，祝你也祝我！）⊹꙳ ˶˙ᵕ˙˶ ⊹꙳——Gardenia Ai2025/5/7&lt;br /&gt;
&lt;br /&gt;
省一（悲），最后能爆个强运蒙进队（我在讲什么）——沿阶草&lt;br /&gt;
&lt;br /&gt;
联赛考好点，离未来更进一步。不奢求省队，毕竟来日方长。祝愿我们一起并肩的🐵 🐭 🐰 🦊 🐻 🐼 🐨 🐯 🦁 🐮 🐷 🐽 🦆 🐥 🐣 🐤 🐧 🐔 🐒 🙊 🐙 🐸 🐶 🐱 🐭 🦉 🐍 🦎 🦀 🦑 🦖 🐂 🦕 🦐 ☘ 🍀🐦🐆🐠 🐟 🐡 🐬 🦈 🐳 🐋👻  ，都能取得自己理想的成绩！！！——🍬&lt;br /&gt;
&lt;br /&gt;
省队，加油。还有🫛—— 🐤&lt;br /&gt;
&lt;br /&gt;
这里是雪豹，痛斥楼上那个把我们队的全部飞禽走兽都拉进来的犬，但别说还怪好玩的🤓👆——Gardenia Ai&lt;br /&gt;
&lt;br /&gt;
&amp;lt;small&amp;gt;不奢求什么啦，只希望最后几天能踏踏实实地做好该做的，考场上发挥出自己应有的水平就行啦，别辜负了自己这么久的努力。也希望自己的一些愿望能够实现呢，&amp;lt;/small&amp;gt;祝各位都多多圆梦！！&amp;lt;small&amp;gt;——2025/5/7 hd&amp;lt;/small&amp;gt;&lt;br /&gt;
&lt;br /&gt;
鸟要挣脱出壳，蛋就是世界。待盛夏，五月息兴，满城且赏黄金之香————Aureatring    2025/5/7&lt;br /&gt;
&lt;br /&gt;
进省队！！！！！希望我能够回来这里还愿——2025.5.7 微.&lt;br /&gt;
&lt;br /&gt;
希望能够稳住省一的位置，向着省队冲刺，同时也祝段、曾、隆、伍、李等进队！——光追    2025/5/7&lt;br /&gt;
&lt;br /&gt;
也就省二水平，还是暗自希望有个省一用来假装自己很努力。祝愿哈集米，海基参，河基妈，哈基赫，哈基舟都进省队！——shiningstars 2025/5/7&lt;br /&gt;
&lt;br /&gt;
= 还愿墙 =&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=6036</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=6036"/>
		<updated>2025-04-30T00:38:50Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心） */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
国际核苷酸序列数据库协作 （INSDC），包含NLM-NCBI(美国）,ENA(欧洲,EMBL与EBI参与),DDBJ(日本),&lt;br /&gt;
&lt;br /&gt;
其创始成员是信息和系统研究组织、日本国家遗传学研究所 （ROIS-NIG）、欧洲分子生物学实验室 - 欧洲生物信息学研究所 （EMBL-EBI） 和美国国立卫生研究院的一个组成部分,国家医学图书馆-国家生物技术信息中心 （NLM-NCBI）。&lt;br /&gt;
&lt;br /&gt;
[https://geekdaxue.co/read/mugpeng@bioinfo/nmbmdk 有现成的]&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
PubMed诞生于1996年。最常用的文摘型数据库。其收录范围不仅包括Medline，还有大部分PMC和NIH基金资助作者的文献，NCBI书籍等。PubMed还提供链接到文献全文所在网站的全文链接。早期 PubMed 数据库主要的任务，是将 Mesh 目录(MEDlINE的早期目录，主题词表)中收录的医学主题与大量有关医学研究的文献相匹配。这意味着，PubMed最早的发布时间应该是在 1971 年，也就是 MEDLINE 数据库第一次正式发布的时间。&lt;br /&gt;
&lt;br /&gt;
MEDLINE始建于1966年（追溯收录至1946年），是NLM的期刊文献记录数据库。1983年，MEDLINE推出电子版，网上数据每日更新，光盘版每月更新。MEDLINE有严格的文献选择委员会LSTRC进行选刊。目前MEDLINE的文献都收录在PubMed中。&lt;br /&gt;
&lt;br /&gt;
PMC全称为PubMed Central，建立于2000年，由NCBI进行管理，是可以免费获取全文的生物医学和生命科学全文数据库，保存了NLM收录印刷杂志的电子副本。PMC的部分bookreview内容没有收录于PubMed。&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
Gempept NCBI关于肽段的数据库&lt;br /&gt;
&lt;br /&gt;
* the GenPept database is a collection of sequences based on translations from annotated coding regions in GenBank.GenPept 数据库是基于 GenBank 中带注释编码区的翻译的序列集合。&lt;br /&gt;
&lt;br /&gt;
Unigene&lt;br /&gt;
&lt;br /&gt;
UniGene最初是在缺乏参考基因组的情况下作为转录序列的基因导向分组，用于广泛的生物体。我们后来加入了基于基因组的分组。UniGene已被用作近似表达谱的来源，可用cDNA克隆的索引，并作为转录导向资源设计的指南。然而，随着短读测序技术的出现，每年提交给NCBI的est越来越少，并且具有相当规模的研究社区的大多数生物体都可以获得参考基因组。因此，UniGene的使用和需求显著下降。[https://ncbiinsights.ncbi.nlm.nih.gov/tag/unigene/ 于2019年7月关闭网页版，仍可以在NCBI找到数据库]&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签数据库，由NCBI维护&lt;br /&gt;
** ESTs是从不同生物体中提取的短序列片段，通常是基因的转录产物。这些ESTs是通过cDNA文库构建和测序获得的，可以提供有关特定基因的信息。ESTs的测序往往是高通量的，可以快速识别和记录大量的基因序列。&lt;br /&gt;
ORFfinder由NCBI开发，用于寻找原核生物ORF(ORF是可能的CDS)&lt;br /&gt;
&lt;br /&gt;
Taxonomy是NCBI维护的关于生物分类的数据库，不包含蛋白质与基因序列，只包含域界门纲目科属种&lt;br /&gt;
&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
** psi-BLAST用位置特异权重矩阵搜索，适合远缘物种相似蛋白/家族新蛋白&lt;br /&gt;
** phi-BLAST模式发现迭代BLAST，仅输出序列中含有特殊模式的对齐&lt;br /&gt;
*** 精准度phiBLAST&amp;gt;BLASTp&amp;gt;psiBLAST,范围psiBLAST&amp;gt;BLASTp&amp;gt;phiBLAST&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== EMBL（European Molecular Biology Laboratory）欧洲分子生物学实验室 ==&lt;br /&gt;
总部位于德国海德堡，1974年由欧洲14个国家加上亚洲的以色列共同发起建立，现在由欧洲29个成员国政府支持组成，目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。&lt;br /&gt;
&lt;br /&gt;
[https://www.embl.org www.embl.org]&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成.2002 年，PIR 与其国际合作伙伴 EBI（欧洲生物信息学研究所）和 SIB（瑞士生物信息学研究所）一起获得了 NIH 的资助，创建了 UniProt。 通过统一 PIR-PSD、Swiss-Prot 和 TrEMBL 数据库，实现蛋白质序列和功能的单一全球数据库。&lt;br /&gt;
* Uniprot提供亚细胞定位，翻译后修饰&lt;br /&gt;
* Uniprot是包含蛋白质序列，功能信息，论文索引的蛋白质数据库，整合了包括EBI,SIB,PIR三大数据库的资源。&lt;br /&gt;
**EMBL-EBI是指欧洲生物信息学研究所（European Bioinformatics Institute），EMBL的一部分。1982年建立了先进的核苷酸序列数据库（EMBL-DNA），可进行核苷酸序列检索及序列相似性查询。TrEMBL&lt;br /&gt;
**SIB,瑞士生物信息学研究所，维护着ExPASy的服务器,Swissprot&lt;br /&gt;
*** &#039;&#039;&#039;ExPASy&#039;&#039;&#039;是一个集成了多种生物信息学工具和数据库的平台，专门用于蛋白质和蛋白质组学的研究。除了蛋白质相关的数据外，ExPASy还提供了其他生物信息学资源，如代谢通路数据库（KEGG京都代谢通路基因什么什么库）等。其中，Protparam工具是经常使用的功能，它可以根据蛋白质序列估计蛋白质的等电点（pi）、疏水性等特性。&lt;br /&gt;
**** [https://web.expasy.org/protscale/ Protscale]判断蛋白质序列的疏水性，返回的结果是疏水性曲线，亲水用负值表示,疏水用正值表示。原理是滑动窗口&lt;br /&gt;
**** Prosite数据库是一个用于存储和提供蛋白质序列和结构特征的资源。 主要功能是提供蛋白质的功能和结构信息可以识别功能域和模式，可用于蛋白质家族和亲缘关系的研究，预测蛋白质结构与功能&lt;br /&gt;
**** [https://web.expasy.org/protparam/ ProtParam]是一个工具，它允许计算存储在UniProtKB中的给定蛋白质或用户输入的蛋白质序列的&#039;&#039;&#039;各种物理和化学参数&#039;&#039;&#039;。计算参数包括分子量、理论pI、氨基酸组成、原子组成、消光系数、估计半衰期、不稳定性指数、脂肪族指数和亲水性大平均值。&lt;br /&gt;
****[http://www.pdg.cnb.uam.es/cursos/Leon_2003/pages/visualizacion/programas_manuales/spdbv_userguide/us.expasy.org/tools/aacomp/index.html AACompIdent]是一种工具，允许从其氨基酸组成鉴定蛋白质。它在Swiss-Prot和/或TrEMBL数据库中搜索氨基酸组成最接近给定氨基酸组成的蛋白质。&lt;br /&gt;
** PIR &#039;&#039;&#039;Protein information resource&#039;&#039;&#039;，由美国国家生物医学研究基金会（NBRF）于1984年成立,用于支持基因组学、蛋白质组学和系统生物学研究和科学研究。提供蛋白质数据库和分析工具，包括蛋白质序列数据库 （PSD）。PIR-PSD&lt;br /&gt;
*数据库的关系&lt;br /&gt;
通过INSDC等得到原始数据，处理后存入UniParc。&lt;br /&gt;
&lt;br /&gt;
UniParc作为数据仓库，再分别给UniProtKB，Proteomes，UniRef提供可靠的数据集。&lt;br /&gt;
这里的UniProtKB 由两个子库构成 Swiss-Prot，TrEMBL。&lt;br /&gt;
&lt;br /&gt;
Swiss-Prot 经过人工验证和注释，是高质量的蛋白质注释数据。但人工效率在高速增长的蛋白质数据面前显得极其低效。因此，注释这些数据需要大量时间，为了弥补这一问题。TrEMBL 被建立用于存储由机器自动翻译和预测的蛋白质序列。导致蛋白质数据冗余↑可信度↓。&lt;br /&gt;
&lt;br /&gt;
简而言之，在UniProtKB数据库中Swiss-Prot是由TrEMBL经过手动注释后得到的高质量非冗余数据库，也是我们今后常用的蛋白质数据库之一。&lt;br /&gt;
&lt;br /&gt;
[https://zhuanlan.zhihu.com/p/599641613 感谢知乎qwq]&lt;br /&gt;
&lt;br /&gt;
*Uniprot内部有UniPrac，Uniref，UniProtKB三层，由粗糙到精细列&lt;br /&gt;
** 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。UniParc由于数据冗余，将相同序列合并一条，唯一编号。&lt;br /&gt;
** 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
** 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&amp;lt;TrEMBL和Swissprot热血沸腾的组合技&amp;gt;&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&lt;br /&gt;
== 蛋白质结构数据库 ==&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质物理特性识别 ===&lt;br /&gt;
Compute pI/Mw&lt;br /&gt;
&lt;br /&gt;
* 计算蛋白质的 &#039;&#039;&#039;等电点（pI） 和 分子量（Mw）&#039;&#039;&#039;，基于氨基酸序列的电荷分布和组成。&lt;br /&gt;
* &#039;&#039;&#039;输入&#039;&#039;&#039;：蛋白质氨基酸序列（FASTA格式）。&#039;&#039;&#039;输出&#039;&#039;&#039;：pI和Mw的数值结果。&lt;br /&gt;
ExPasy的protogram数据库亦有记载&lt;br /&gt;
&lt;br /&gt;
=== 一级结构数据库 ===&lt;br /&gt;
PDB蛋白质结构数据库(Protein Data Bank)是美国Brookhaven国家实验室于1971年创建的，由结构生物信息学研究合作组织(RCSB)维护。&lt;br /&gt;
* PDB数据库以文本文件形式存储分子数据，每个分子形用一个独立的文件。早期的分子文件的文件名后缀为“.pdb”，1997年以后每1种生物大分子对应1组(3个)相关文件分别是：全文文件(后缀为“.full”相当于原来的“.pdb”文件)、书目文件(后缀为“.biblio”)和图形文件(后缀为“.gif”)。&lt;br /&gt;
* PDB数据库是生物大分子的原子坐标和描述蛋白质和其他重要生物大分子相关信息的存储库。结构生物学家使用x 射线晶体学、核磁共振光谱和冷冻电子显微镜等方法来确定分子中每个原子相对于彼此的位置，然后存储这些信息，并由PDB数据库注释并公开发布到档案中。&lt;br /&gt;
**[https://zhuanlan.zhihu.com/p/589697113/]&lt;br /&gt;
[https://www.rcsb.org/]&lt;br /&gt;
&lt;br /&gt;
=== 二级结构数据库 ===&lt;br /&gt;
DSSP工具：DSSP程序是一个二级结构分配（以及更多信息）的数据库，涵盖PDB中的所有蛋白质条目。DSSP也是从PDB条目计算DSSP条目的程序。DSSP并不预测二级结构。&lt;br /&gt;
&lt;br /&gt;
* 根据氢键模式和主链构象，将蛋白质的每个残基分类为特定的二级结构类型。算残基之间的氢键能量，用于确定二级结构的边界。计算每个残基的溶剂可及表面积（ASA），反映其在蛋白质表面的暴露程度。&lt;br /&gt;
* 输入：蛋白质的三维结构文件（通常为PDB格式）。输出：包含每个残基的二级结构类型、氢键信息、溶剂可及性等数据的文本文件。&lt;br /&gt;
&lt;br /&gt;
Pfam数据库重视&#039;&#039;&#039;蛋白质结构域和家族&#039;&#039;&#039;（基于序列同源性）分为Pfam-A和Pfam-B。。Pfam数据库主要用于蛋白质家族的分类和功能注释。&lt;br /&gt;
&lt;br /&gt;
* Pfam-A是手工整理的高质量家族集合，&lt;br /&gt;
* Pfam-B是自动生成的家族集合，具有更广泛但相对较低的准确性&lt;br /&gt;
&lt;br /&gt;
* 关注功能相关的蛋白质区域（如结构域），而非完整蛋白质的结构。&lt;br /&gt;
&lt;br /&gt;
* 分类依据：&lt;br /&gt;
** &#039;&#039;&#039;序列相似性&#039;&#039;&#039;，通过隐马尔可夫模型（HMM）比对识别保守区域。&lt;br /&gt;
** 基于多序列比对和进化关系。&lt;br /&gt;
&lt;br /&gt;
* 层次结构：&lt;br /&gt;
** 超家族（Clan）：多个家族在进化或功能上的关联。&lt;br /&gt;
** 家族（Family）：具有显著序列相似性的结构域集合&lt;br /&gt;
* Pfam的链接都已经重新定位到Interpro了,也是EMBL-EBI生的&lt;br /&gt;
&lt;br /&gt;
CATH数据库提供蛋白质三维结构与分类，关注&#039;&#039;&#039;结构的拓扑和进化起源&#039;&#039;&#039;。&lt;br /&gt;
&lt;br /&gt;
* 蛋白质三维结构的层次化分类（从二级结构到进化关系）以三维结构特征为依据，结合序列和功能信息进行分类&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构组成（如全α、全β、α+β、α/β）。&lt;br /&gt;
*# Architecture（架构）：描述二级结构的空间排布（如β桶、α螺旋束）。&lt;br /&gt;
*# Topology（拓扑）：基于折叠方式和连接性。&lt;br /&gt;
*# Homologous Superfamily&#039;&#039;&#039;（&#039;&#039;&#039;同源超家族）：进化相关的蛋白质。&lt;br /&gt;
&lt;br /&gt;
SCOP数据库分类强调进化同源性，基于结构与进化关系分类，由&#039;&#039;&#039;专家手动分类，强调超家族内的远缘同源关系。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构类型（如全α、全β等）。&lt;br /&gt;
*# Fold（折叠方式）：具有相似拓扑结构的蛋白质。&lt;br /&gt;
*# Superfamily（超家族）：推测具有共同祖先的结构相似蛋白质。&lt;br /&gt;
*# Family（家族）：明确序列同源性的蛋白质集合。&lt;br /&gt;
&lt;br /&gt;
* SCOPe引入自动化分类，但核心仍保留手动注释。&lt;br /&gt;
&amp;lt;这段deepseek写的，我对着笔记查了一下&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质三级结构预测 ===&lt;br /&gt;
* I-TASSER穿线法预测：有相似才能用从PDB中识别结构模板，并通过基于迭代模板的碎片组装模拟构建完整的原子模型(将蛋白质“穿入”已有的蛋白质结构模板)。 接着通过蛋白质功能数据库BioLiP对3D模型进行重新线程化，从而预测功能。&lt;br /&gt;
** 有人把ITASSER归进从头建模了&lt;br /&gt;
&lt;br /&gt;
* Swissmodel同源建模：按照FASTA格式输入氨基酸序列，要有相似度&amp;gt;30%的蛋白质模板&lt;br /&gt;
** 同源建模也称为比较建模，根据与已知结构的序列同源性预测蛋白质结构。基于“如果两个蛋白质具有足够高的序列相似性，它们很可能具有非常相似的三维结构”的原理。如果蛋白质序列之一具有已知结构，则可以以高置信度将该结构复制/映射到未知蛋白质。&lt;br /&gt;
** 质量评估：其中相似度值，即序列同源性经比对后结果在 40% 以上，则待预测蛋白与模板蛋白结构大概为同源蛋白，则同源建模方法可用于预测该蛋白三维结构。根据GMQE值及ＱＭEAN值评价结果，都是全局比对。&lt;br /&gt;
*** GMQE值在0－1之间，越接近１则建模质量越好&lt;br /&gt;
*** QMEAN值关于覆盖率区间为－４－０，越接近０则匹配度越好。&lt;br /&gt;
** 此功能在Modelle(蛋白质复合体同源建模)与Discovery Studio与AlphaFold-Multimer亦有记载&lt;br /&gt;
* QUARK从头计算：从头经历复杂的算法归纳到能量最低，此事在Alphafold亦有记载&lt;br /&gt;
* Rosetta综合以上算法，但亦有说同源建模的&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质功能与结构域数据库&amp;amp;预测 ===&lt;br /&gt;
&lt;br /&gt;
* InterPro是集成的蛋白质结构域和功能位点数据库，包含关于蛋白质家族、域、重复序列、和作用位点等数据资源。InterPro通过将蛋白质分类为家族并预测结构域和重要位点来提供蛋白质的功能分析。为了以这种方式对蛋白质进行分类，InterPro 使用由组成 InterPro 联盟的多个不同数据库（称为成员数据库）提供的预测模型（称为特征）。&lt;br /&gt;
** InterPro包含很多来自不同数据库的人工注释文件，形成了一个给定的蛋白质家族、结构域和功能位点的独特描述。&lt;br /&gt;
** Interpro数据库成员包括Coils 、Gene3D、Pfam、PRINTS、ProSitePatterns、ProSiteProfiles、SMART、SUPERFAMILY、 TIGRFAM、ProDom、PIR 数据库，每两个月更新一次&lt;br /&gt;
** EBI生的，可能假阳性&lt;br /&gt;
* Pfam数据库是一个庞大的蛋白质家族集合，每个家族都由多个序列比对和隐马尔可夫模型（HMMs）表示&lt;br /&gt;
* SMART 是一个用于蛋白质结构域鉴定、注释的在线分析工具。它的数据与UniProt、Ensembl和STRING数据库同步&lt;br /&gt;
** 您可以在两种不同的模式下使用 SMART：&#039;&#039;&#039;正常&#039;&#039;&#039;模式或&#039;&#039;&#039;基因组&#039;&#039;&#039;模式。主要区别在于所使用的基础蛋白质数据库。&lt;br /&gt;
** 在 &#039;&#039;&#039;Normal SMART&#039;&#039;&#039; 中，数据库包含 Swiss-Prot、SP-TrEMBL 和稳定的 Ensembl 蛋白质组。即使删除了相同的蛋白质，Normal SMART 中的蛋白质数据库具有显著的冗余性，&lt;br /&gt;
** 在 &#039;&#039;&#039;Genomic SMART&#039;&#039;&#039; 中，仅使用完全测序基因组的蛋白质组;后生动物的 Ensembl 和其余的 Swiss-Prot。如果您使用 SMART 来探索结构域架构，或者想要在各种基因组中查找确切的结构域计数，请考虑切换到&#039;&#039;&#039;基因组&#039;&#039;&#039;模式。结构域标注页中的数字会更准确，架构查询结果中不会有很多对应同一个基因的蛋白片段。&lt;br /&gt;
&lt;br /&gt;
=== 蛋白相互作用库 ===&lt;br /&gt;
&lt;br /&gt;
* DIP&amp;lt;sup&amp;gt;TM&amp;lt;/sup&amp;gt; 数据库对实验确定的蛋白质之间的相互作用进行了编目。它结合了来自各种来源的信息，以创建一组单一、一致的蛋白质-蛋白质相互作用。存储在 DIP 数据库中的数据既由专家策展人手动管理，也使用计算方法自动管理&lt;br /&gt;
* BioGRID(Biological General Repository for Interaction Datasets)数据库 生物相互作用网络，是由大量单个蛋白质或遗传相互作用以及RNA，DNA，膜，碳水化合物和小分子代谢物的相互作用聚集形成的，BioGRID致力于所有主要模式生物物种和人类的蛋白质，遗传和药物相互作用的管理和存[https://www.jianshu.com/p/63a5834c2fe9 储]&lt;br /&gt;
** 合并了DrugBank中的化学-蛋白质相互作用记录&lt;br /&gt;
** 为了协调和统一不同模式生物研究中使用的各种遗传相互作用术语，BioGRID与WormBase([https://wormbase.org/#012-34-5 线虫数据库])合作开发了新的标准化遗传相互作用结构术语或GIST。GIST已设计为使用通用遗传相互作用术语精确指定遗传相互作用&lt;br /&gt;
** BioGRID ORCS：用于CRISPR筛选数据的存储单元&lt;br /&gt;
* STRING功能性蛋白质关联网络。收集多个公共数据库，包括UniProt、KEGG、NCBI和Gene Ontology整合并生成一个全面的蛋白质相互作用网络数据库。&lt;br /&gt;
** 返回结果是网状的蛋白质互作消息&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质多序列比对 ===&lt;br /&gt;
多序列比对MSA是指把多条（3 条或以上）有系统进化关系的蛋白质分子的氨基酸序列或核酸序列进行比对，尽可能地把相同的碱基或氨基酸残基排在同一列上。对齐的碱基或氨基酸残基在进化上是同源的，即来自共同祖先。&lt;br /&gt;
&lt;br /&gt;
序列比对主要是为了寻找相似的序列，相似的序列往往起源于一个共同的祖先序列，它们很可能有相似的空间结构和生物学功能，有利于推测这个未知结构和功能的蛋白质的结构和功能。&lt;br /&gt;
&lt;br /&gt;
* Tcoffee核酸和蛋白质都可以&lt;br /&gt;
** 基本原理是首先构建一个包含有clustalw得到的序列两两比对和fasta得到的局部两两比对数据的库,并且给每个比对一个权重.然后把结果进行整合,最后是progressive比对过程.&lt;br /&gt;
** Rcoffee可以根据预测的RNA二级结构对比序列&lt;br /&gt;
* ClustralW有快慢两种模式，&lt;br /&gt;
** 原理是两两比对-&amp;gt;两两之间距离矩阵-&amp;gt;NJ建Binary进化树作为guidetree-&amp;gt;用progressive的方法添加序列到树上直到比对完成&lt;br /&gt;
** 有Accurate慢和Appropriate快两种模式，Accruate比Tcoffee快，Appropriate比Muscle慢&lt;br /&gt;
* Muscle&lt;br /&gt;
** 它之所以比clustalw快一方面是因为没有进行两两序列比对,用序列间共有的word数表征序列间的相似性;另一方面用UPGMA代替NJ构建guide tree. 如果没有对于结果的refinement过程,时间更短,时间复杂度为O(NL^2),也就是说时间和序列数成线性关系.&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质数据质量评估 ===&lt;br /&gt;
&lt;br /&gt;
* PROCHECK&lt;br /&gt;
** 在对蛋白的二级结构进行评估之时,一个重要的指标就是二面角φ, ψ是否在合理范围之内, 其中φ代表 α 碳原子和氮原子间的键的旋转度phi, ψ代表α碳原子和羰基碳原子间的键的旋转度。PROCHECK可以计算给定PDB文件的所有φ, ψ二面角, 然后给出总的评估结果,并将结果绘制成Ramachandran图表示。&lt;br /&gt;
** 不少于90%的二面角分布在图中的合理(蓝色)区域，则蛋白结构合理&lt;br /&gt;
* VERIFY_3D&lt;br /&gt;
** 对同源建模所得模型的质量进行了可视化分析，用来判断模型与氨基酸序列之间的兼容性。&lt;br /&gt;
** 对氨基酸残基数大于100的蛋白质，VERIFY_3D的评估结果更准确。&lt;br /&gt;
** 当不低于80%的氨基酸残基得分大 0.2时，即可认为目的蛋白建模所得模型属于高质量的模型结构。&lt;br /&gt;
* [https://proq.bioinfo.se/ProQ/ProQ.html ProQ - 蛋白质质量评价]&amp;lt;这个没找到总结&amp;gt; ProQ 是一种基于神经网络的预测器，它基于许多 结构特征可预测蛋白质模型的质量。ProQ 是 优化以找到正确的模型，与其他方法相比 经过优化以查找原生结构。两个质量衡量标准是 预测 LGscore 和 MaxSub。  LGscore 是 P 值的 -log，MaxSub 范围为 0-1，其中 0 为 微不足道和 1 个非常显著。&lt;br /&gt;
&lt;br /&gt;
=== 跨膜序列预测 ===&lt;br /&gt;
&lt;br /&gt;
* TMHMM由丹麦的CBS维护，使用隐马尔可夫模型预测跨膜蛋白序列&lt;br /&gt;
&lt;br /&gt;
* TMpred预测蛋白质的跨膜结构域（TMDs），基于氨基酸疏水性分析。输入蛋白质序列，输出跨膜区的位置、与拓扑结构（膜内/膜外方向）&lt;br /&gt;
&lt;br /&gt;
=== 信号肽SignalP ===&lt;br /&gt;
&lt;br /&gt;
* 预测蛋白质的 信号肽及其切割位点，判断是否为分泌蛋白或膜蛋白。&lt;br /&gt;
* &#039;&#039;&#039;输入&#039;&#039;&#039;：蛋白质序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：信号肽位置、切割位点概率、分泌类型（Sec/SPI/Tat）。&lt;br /&gt;
&lt;br /&gt;
=== 螺旋曲结构预测COILS ===&lt;br /&gt;
COILS 是一个程序，可将序列与已知平行双股盘绕线圈的数据库进行比较，并得出相似性分数。通过将此分数与球状和卷曲螺旋蛋白中的分数分布进行比较，该程序然后计算该序列将采用卷曲螺旋构象的概率。&lt;br /&gt;
&lt;br /&gt;
PSORT蛋白质亚细胞定位&amp;lt;ref&amp;gt;[https://zhuanlan.zhihu.com/p/426325112]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质修饰预测 ===&lt;br /&gt;
NMT蛋白质甲基化预测&lt;br /&gt;
&lt;br /&gt;
NetPho蛋白质磷酸化预测&lt;br /&gt;
&lt;br /&gt;
NetAcet蛋白质乙酰化&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== 搞人小数据库，考了之后就把名字全记下来了 ==&lt;br /&gt;
&lt;br /&gt;
=== 调控元件与内含子/外显子 ===&lt;br /&gt;
&lt;br /&gt;
* PLACE&#039;&#039;&#039;植物顺式作用元件数据库&#039;&#039;&#039;（Plant Cis-Acting Regulatory DNA Elements），存储植物启动子区域的功能性调控元件。&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：DNA序列（如启动子区域）。&#039;&#039;&#039;输出&#039;&#039;&#039;：匹配的调控元件名称、位置及功能注释。&lt;br /&gt;
* Augustus真核生物基因结构预测&lt;br /&gt;
** 基于隐马尔可夫模型（HMM）和物种特异性训练数据预测基因结构。&lt;br /&gt;
*** 可以直接预测训练之后的物种。若不存在被训练过的物种，需要[https://www.jianshu.com/p/6f7b2998600c 准备训练集和测试集进行训练]  可靠的基因结构序列的要求如下： 之后随机将注释数据集分成训练集和测试集，测试集要足够多的基因（100~200个），并且要足够的随机。  a. 提供基因的编码部分，包含上游几KB。通常，基因越多越好。还得保证有足够多的外显子，这样子才能训练内含子  b. 这些基因的基因结构一定足够准确。不过，也不需要百分百正确，只要保证起始密码子和终止密码子是准确的。  c. 需要保证这些基因没有冗余，不同序列如果有几乎相同的注释后氨基酸序列，那么仅仅取其中一个  d. 一条序列允许有多个基因，基因可以在正链也可以在负链，但是这些基因间不能有重叠，每个基因只要其中一个转录本，存放格式是GenBank&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：基因组DNA序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：预测的基因模型（外显子、内含子、CDS区域）、蛋白质序列。&lt;br /&gt;
* ORFfinder&lt;br /&gt;
** 识别DNA序列中的 开放阅读框ORF，基于遗传密码表扫描可能的编码区域。&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：DNA序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：ORF的位置、长度、翻译的氨基酸序列。&lt;br /&gt;
&lt;br /&gt;
=== 基因比对 ===&lt;br /&gt;
BWA-MEM自动选择全局/局部算法，长序列更适合&lt;br /&gt;
&lt;br /&gt;
SOAP快，短序列更加合适&lt;br /&gt;
&lt;br /&gt;
NovoAlign慢而准确&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E5%93%88%E8%BF%AA-%E6%B8%A9%E4%BC%AF%E6%A0%BC%E5%B9%B3%E8%A1%A1%E5%92%8C%E5%8F%98%E4%BD%93&amp;diff=6034</id>
		<title>哈迪-温伯格平衡和变体</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E5%93%88%E8%BF%AA-%E6%B8%A9%E4%BC%AF%E6%A0%BC%E5%B9%B3%E8%A1%A1%E5%92%8C%E5%8F%98%E4%BD%93&amp;diff=6034"/>
		<updated>2025-04-29T14:48:05Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​写不下去了，因为忘了要产生多少aa了&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;本页面介绍哈迪温伯格平衡和它的变体与计算，由于笔者水平有限，希望指正！qwq&lt;br /&gt;
&lt;br /&gt;
=== 哈迪-温伯格平衡 ===&lt;br /&gt;
在一个不存在突变，不存在迁移，不存在选择，不存在遗传漂变，交配完全随机的种群中，对于等位基因A与a(隐性)，它们的比例将达到p：q且在交配中保持不变。平衡时A频率为p，a频率为q，有&lt;br /&gt;
&lt;br /&gt;
* p+q=1&lt;br /&gt;
* AA频率为p²，Aa频率为2pq，aa频率为q²&lt;br /&gt;
* p²+q²+2pq=1&lt;br /&gt;
&lt;br /&gt;
=== &#039;&#039;&#039;哈迪温伯格与选择&#039;&#039;&#039; ===&lt;br /&gt;
设某一基因型产生的后代为不存在选择的基因型的s倍，s为适合度（相对适合度）比如aa收到了负选择，有s&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|+&lt;br /&gt;
!&lt;br /&gt;
!AA&lt;br /&gt;
!Aa&lt;br /&gt;
!aa&lt;br /&gt;
|-&lt;br /&gt;
|频率&lt;br /&gt;
|p²&lt;br /&gt;
|2pq&lt;br /&gt;
|q²&lt;br /&gt;
|-&lt;br /&gt;
|选择系数&lt;br /&gt;
|1&lt;br /&gt;
|1&lt;br /&gt;
|s&lt;br /&gt;
|-&lt;br /&gt;
|下一代数&lt;br /&gt;
|p²&lt;br /&gt;
|2pq&lt;br /&gt;
|sq²&lt;br /&gt;
|-&lt;br /&gt;
|下一代频率&lt;br /&gt;
|p²/p²+sq²+2pq&lt;br /&gt;
|2pq/p²+sq²+2pq&lt;br /&gt;
|sq²/p²+sq²+2pq&lt;br /&gt;
|}&lt;br /&gt;
经过许多代的选择与随机交配，最终可以发现&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E6%8F%90%E5%87%BA%E4%BD%A0%E7%9A%84%E9%97%AE%E9%A2%98&amp;diff=5896</id>
		<title>提出你的问题</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E6%8F%90%E5%87%BA%E4%BD%A0%E7%9A%84%E9%97%AE%E9%A2%98&amp;diff=5896"/>
		<updated>2025-04-27T09:02:14Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* 动物及生理学 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;br /&gt;
应该有不少生物竞赛的学生在访问这个网站。为此创建这样一个页面。&lt;br /&gt;
&lt;br /&gt;
提问者：注册一个账号即可编辑，请在“未解答”栏目写下你学竞赛的问题，&#039;&#039;&#039;请注明身份。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
回答者：大佬们可以访问这个页面来查看有没有新的问题。如果您可以解答，请在问题下方编辑（没有编辑按钮就去登录）好回答，并将该词条转移到“已解答”栏目。&lt;br /&gt;
&lt;br /&gt;
或者也可以在这里提出您需要的整理。&lt;br /&gt;
&lt;br /&gt;
建议大家回答问题的时候标注一下知识来源&lt;br /&gt;
&lt;br /&gt;
== 未解答 ==&lt;br /&gt;
&lt;br /&gt;
=== 遗传学 ===&lt;br /&gt;
如果一对等位基因之中一个缺失了，让此二倍体生物不断自交，可否因为缺失同源区段无法交换发生假连锁。&lt;br /&gt;
&lt;br /&gt;
XXY的果蝇如果Sxl的PE启动子突变了，可以发育成有育性的雄果蝇吗？&lt;br /&gt;
&lt;br /&gt;
=== 生物化学 ===&lt;br /&gt;
&lt;br /&gt;
甲酰CoA在人体中是怎么代谢的？&lt;br /&gt;
&lt;br /&gt;
二羟丙酮的还原性源自哪里？&lt;br /&gt;
&lt;br /&gt;
肝中醛缩酶B机理是同A（共价席夫碱）还是同真菌细菌中Zn2+金属催化？（我猜测是同A，可能是基因*2的产物）&lt;br /&gt;
&lt;br /&gt;
=== 生物技术 ===&lt;br /&gt;
基因工程载体的转化，只能特指对原核细胞的操作吗？(同：转染也特指对真核细胞？)除此之外，转化与转染还有没有其他的本质差异？&lt;br /&gt;
&lt;br /&gt;
=== 生态学 ===&lt;br /&gt;
求英美学派，法瑞学派，前苏联学派和北欧学派的区别qwq&lt;br /&gt;
&lt;br /&gt;
求问一些计算频度或基盖度时取样地的规模或高度的整理&lt;br /&gt;
=== 生物信息 ===&lt;br /&gt;
如何在uniprot中查询蛋白复合体的结构？如果不能，有什么组装蛋白复合体的软件？&lt;br /&gt;
&lt;br /&gt;
=== 分子生物学 ===&lt;br /&gt;
链霉溶菌素和利链霉素是一个东西吗？（根据找到的资料，它们都作用于RNA聚合酶的核心酶β亚基，抑制转录延伸）&lt;br /&gt;
&lt;br /&gt;
关于杨Sir新版生化中的一个矛盾点(个人认为可能是杨Sir写错了，麻烦各位佬看看)：第四版P660中关于加尾反应的CTD磷酸化信号的叙述中，杨Sir明确表明Ser2的磷酸化是由TFIIH介导的，但与前述转录进入延伸后THIIH留在起始处似乎矛盾，本人翻看了Weaver和杨Sir的分子，其中Weaver并未提及相关内容，而杨Sir的分子第二版中只在BOX8-1中含糊其辞的提到“可由不同的蛋白激酶催化”，上网搜索找到一篇文章(CDK13 cooperates with CDK12 to control global RNApolymerase II processivity)，发现CDK12/13磷酸化了CTD中的Ser2，双敲除突变体会导致加尾异常，故认为应该是杨Sir写错了（顺便问一句这个可以去哪里给杨Sir反馈一下吗？）&lt;br /&gt;
&lt;br /&gt;
有佬能简单对比一下相向复制（朱玉贤P44）与单向，双向复制的区别吗？&lt;br /&gt;
&lt;br /&gt;
=== 植物及生理学 ===&lt;br /&gt;
&lt;br /&gt;
关于蕨类的幼叶拳卷现象，是大多数蕨类都有？还是只有真蕨亚门有呢？有哪些蕨类没有？&lt;br /&gt;
&lt;br /&gt;
乙醇酸氧化酶和黄素氧化剂酶的区别？详细些的求求了（末端氧化酶）&lt;br /&gt;
&lt;br /&gt;
看图要怎么区分假年轮和年轮？&lt;br /&gt;
&lt;br /&gt;
有关光合作用电子传递中的原初电子受体、原初电子供体以及D、P、A的定义好像很混乱，在王小菁第八版、潘瑞炽第七版和武维华第三版上面的说法都不一样，那么那本书是正确的呢？还是说就是有争议的？（我没有外文教材，所以不知道国外怎么写的）&lt;br /&gt;
&lt;br /&gt;
武维华书中关于钴元素，表述为豆科植物Co含量高而禾本科含量少；wikipedia中指出Co促进豆科植物共生根瘤菌的固氮作用。请问其机理是什么？&lt;br /&gt;
&lt;br /&gt;
十字花科、石竹科、禾本科都有干柱头，同时它们都是三细胞型花粉粒，请问其中有何联系？&lt;br /&gt;
&lt;br /&gt;
花药壁纤维层的细胞径向壁到底有没有加厚？陆和马的图上画的好像有，但是文字描述没说有还是没有；傅承新上说有。&lt;br /&gt;
&lt;br /&gt;
=== 动物及生理学 ===&lt;br /&gt;
能不能整理一下生理学毒素和特异性阻断剂&lt;br /&gt;
&lt;br /&gt;
能认真说说关于多孔动物门的胚胎逆转现象吗&lt;br /&gt;
&lt;br /&gt;
关于应激反应和应急反应，参加反应的激素有哪些区别呢？&lt;br /&gt;
&lt;br /&gt;
腹毛动物是假体腔动物还是无体腔动物？其有没有假体腔？&lt;br /&gt;
&lt;br /&gt;
关于乌贼的石灰质内壳，应该是来源于外套膜的分泌，同时体内出现了中胚层形成的软骨，为什么说石灰质内壳是外、中胚层来源的呢？&lt;br /&gt;
&lt;br /&gt;
肋骨三问：&lt;br /&gt;
&lt;br /&gt;
# 原始两栖类和爬行类它们全身具肋骨，同时还具有不同形态，不同发达程度的双锥体，它们的椎弓位置也在变化，那么它们的肋骨是如何与脊椎相连的？希望有个总结。&lt;br /&gt;
# 肉鳍鱼亚纲基部类群皆无椎体结构，那么他们是否有肋骨？如果有他们是和鲟鱼一样与基腹弓片形成关节还是另有可能？&lt;br /&gt;
# 鸟类椎肋和胸肋之间的关节是否是用于呼吸，因为它椎肋被椎状突固定而胸肋又被龙骨突固定死，需要有活动胸廓的位置？&lt;br /&gt;
&lt;br /&gt;
任淑仙《无脊椎动物学（第二版）》P248讲节肢动物的复眼小眼时，在重叠像一段提到了“屏幕效应”，本人搜索无果，望众贤解答（虽然是小细节）&lt;br /&gt;
&lt;br /&gt;
求孢子纲系统发生上重要事件&lt;br /&gt;
&lt;br /&gt;
求一个各种动物的血小板或血栓细胞等的总结&lt;br /&gt;
&lt;br /&gt;
胆碱能性荨麻疹发病机制&lt;br /&gt;
&lt;br /&gt;
能不能整理一下解剖各种模式动物的方法步骤和注意事项&lt;br /&gt;
&lt;br /&gt;
哪些神经递质或激素对应的受体通过G蛋白βγ亚基进行信号转导（细胞书、生理书还有机构讲的都不完全一致）？&lt;br /&gt;
&lt;br /&gt;
关于园田螺的血色蛋白：&lt;br /&gt;
&lt;br /&gt;
猿辅导某套综合卷解析视频中给的总结是：园田螺无血色蛋白，依赖血清蛋白运输氧气&lt;br /&gt;
&lt;br /&gt;
而《普动》上写的是具有血蓝蛋白(P202)，上网搜查两种说法都能找到，所以实际上是什么呢？&lt;br /&gt;
&lt;br /&gt;
请问蚯蚓 有无蚯蚓血红蛋白？好像认为蚯蚓血红蛋白是沙蚕里的。&lt;br /&gt;
&lt;br /&gt;
多孔动物的胚胎逆转到底指的是植物极大细胞开孔到形成两囊幼虫的过程，还是两囊幼虫小细胞内陷的过程？&lt;br /&gt;
&lt;br /&gt;
能否整理一下昆虫的激素分泌以及作用？&lt;br /&gt;
&lt;br /&gt;
楯鳃和羽状鳃有什么区别？我看它们的描述都是鳃轴两侧均有鳃丝，先端游离呈羽状&lt;br /&gt;
&lt;br /&gt;
犀鸟什么趾型，鸟类学只是说不是对趾&lt;br /&gt;
&lt;br /&gt;
薮枝螅水螅体的触手是实心还是空心的？（普动和无脊椎中的描述貌似矛盾了）&lt;br /&gt;
&lt;br /&gt;
=== 动物行为学 ===&lt;br /&gt;
负竞争和反竞争是什么概念，有什么例子吗&lt;br /&gt;
&lt;br /&gt;
固定行为型的强度速度怎样被刺激强度影响，有什么例子吗&lt;br /&gt;
&lt;br /&gt;
=== 细胞生物学 ===&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
== 已解答 ==&lt;br /&gt;
&lt;br /&gt;
=== 植物学 ===&lt;br /&gt;
&lt;br /&gt;
==== 弹丝与假弹丝分别是几倍体： ====&lt;br /&gt;
除了吴国芳，马炜梁两本书上含混不清的阐述，我所见到全部其他资料都表示：弹丝，假弹丝都是二倍体。区别在于：弹丝是单细胞的，有螺纹的加厚，而假弹丝是多细胞连成的，无螺纹加厚。&lt;br /&gt;
&lt;br /&gt;
弹丝是小孢子母细胞不经过减数分裂形成，为2n；假弹丝是造孢细胞的子细胞连续有丝分裂形成(含2-4个细胞)，为2n&lt;br /&gt;
&lt;br /&gt;
注:如果你和我一样用的&#039;&#039;&#039;喵&#039;&#039;&#039;的古早网课的话，不必在意其中弹丝是n的奇妙言论&lt;br /&gt;
&lt;br /&gt;
==== 水韭的形成层： ====&lt;br /&gt;
这是一个至今仍有争议的问题。一般认为水韭有形成层，但只向内形成次生木质部，向外形成皮层而非韧皮部。[https://doi.org/10.1086/329874 参考文献]&lt;br /&gt;
&lt;br /&gt;
——答主的参考文献写的是&amp;quot;The cambium does not form phloem&amp;quot;？应该是形成层只形成次生木质部而不产生次生韧皮部才对啊？&lt;br /&gt;
&lt;br /&gt;
==== 2024年联赛有关禾本科颖片、稃片的一题有何问题 ====&lt;br /&gt;
根据马炜梁，四个选项都是苞片（见三版P382与P257）。按最新的分子证据，内稃外稃都是花被同源，因此怎么也犯不着选ABC。评议稿答案给ABC可能是因为很多机构是这么讲的。&lt;br /&gt;
&lt;br /&gt;
——根据陆时万，答案是ABC。还有一两本教材，也跟随了陆时万的说法。本以为这个题在通行的教材上有争议所以答案可能是遵循了最新的研究，没想到是最古早的陆时万的说法。我只能说出题人学的二五八万的还想考察别人。&lt;br /&gt;
&lt;br /&gt;
——黎维平在论文《关于禾本科的一些误解——植物学教材质疑(八)》中详细整理描述了学界关于这一问题的几种观点：[https://lib.cqvip.com/Qikan/Article/Detail?id=7107555585&amp;amp;from=Qikan_Search_Index]&lt;br /&gt;
&lt;br /&gt;
# &amp;lt;s&amp;gt;外稃-特化的苞片，内稃-两片近轴端合生的小苞片，浆片-变态的花被片&amp;lt;/s&amp;gt;&lt;br /&gt;
# 外稃-苞片，内稃-两枚合生的外轮花被片，浆片-变态的花瓣（内轮花被片）&lt;br /&gt;
# 【有分子证据】外稃、内稃-外轮花被&lt;br /&gt;
# &amp;lt;s&amp;gt;外稃、内稃-苞片&amp;lt;/s&amp;gt;&lt;br /&gt;
&lt;br /&gt;
* 颖片被广泛认为是苞片与总苞片，同时有分子证据支持/反对颖片与外稃同源&lt;br /&gt;
&lt;br /&gt;
* 最后总结：浆片是内轮花被片（这是学界共识），内稃是外轮花被（得到分子、发育证据支持），颖片与叶同源应该没有异议，但是外稃的来源仍然存在争议。&lt;br /&gt;
&lt;br /&gt;
==== APG 分类系统较传统分类系统增加了哪些科级新类别？ ====&lt;br /&gt;
首先纠正一点，APG系统里面没有科的概念，都是单系群。叫科只是大家习惯这么说了而已。具体的改动比较明显的马炜梁已经讲过了。例如被压榨的百合科，移到石蒜科的葱属，原玄参科现在泡桐科的泡桐，新加的车前科；还有很多被并入或拆分的科，例如原忍冬科的荚蒾属接骨木属被并入五福花科，椴树科、梧桐科、木棉科的植物并入锦葵科，毛茛科的芍药升为芍药科。还有很多的细节，题主可以买一本浙大傅承新植物学第二版看看。改动特别明显且是必背科的有玄参科、百合科、锦葵科、天门冬科、忍冬科、五味子科。&lt;br /&gt;
&lt;br /&gt;
==== 石竹目胎座的演化关系？ ====&lt;br /&gt;
中轴胎座(石竹科麦瓶草属：中轴胎座，但子房室间隔在上部已消失，形成不完全的3室)→特立中央胎座(石竹科的大多数，子房室间隔消失)→基底胎座，胚珠减少→最终阶段：藜科(基底胎座，1胚珠，胞果)&lt;br /&gt;
&lt;br /&gt;
==== 菊科假舌状花是否可以结实？网上显示假舌状花属于雌花或中性花，理论上可以结实？若可以结实，请问哪些常见菊科植物的假舌状花属于雌花呢？谢谢！(类别：植物学) － 来自重庆某新高一生竞生 ====&lt;br /&gt;
雌性的可以，中性的不能。菊花就是边缘假舌状花和管状花都结实。见陆时万植物学修订版下册P315菊属第三行“雌性，假舌状，两者均结实”。再比如向日葵边缘的花就是中性的不能结实，没见过吃的瓜子有从边缘花摘的&lt;br /&gt;
&lt;br /&gt;
==== 关于地钱假根：马炜梁老师书P172图8-4a中将地钱配子体下表皮的多细胞结构称为鳞片，而浙大傅承新老师书P85图4-52中将其称为多细胞鳞片状假根，网上搜索结果显示该结构具有吸收功能，所以何者说法更准确？ ====&lt;br /&gt;
A1:个人觉得要真是考试用的话建议按马炜梁记，吸收功能的话马炜梁那本书应该也承认了有这个功能，傅承新的那本书做出这个结论也应该是基于功能的，不过也不排除有分子学证据支持两者同源的，只是目前我查到的非中文资料里没有几个特别强调“鳞片”和“假根”两个词的，倒是&amp;quot;rhizoids&amp;quot;（“根状体”）一词用的较多。&lt;br /&gt;
&lt;br /&gt;
A2:有一个首都师范大学做苔藓的博士说，多细胞的是鳞片，单细胞的是假根，陆时万的植物学认为两者都有吸收功能（很有限）&lt;br /&gt;
====苏铁叶算羽状复叶还是羽状深裂====&lt;br /&gt;
据多识植物百科，应为羽状深裂&lt;br /&gt;
&lt;br /&gt;
==== 植物孤雌生殖产生几倍体 ====&lt;br /&gt;
这个东西就涉及到一个争议性比较大（主要是主流教材写的都有些问题）的内容--无融合生殖。不过一般来说参考胡适宜先生的《被子植物生殖生物学》比较多些。这个问题就依胡适宜先生的观点解释了。&lt;br /&gt;
&lt;br /&gt;
单就“孤雌生殖”这个名词而言，是被归入了单倍体无融合生殖的，也就是说，这个植株是源于未受精的减数分裂后的细胞，因此其实产生的是单倍体植株而且大多不育。再细讲一点的话这个名词只局限于由单倍体的卵细胞发育成新植株，而由反足细胞和助细胞发育的我们称为无配子生殖。&lt;br /&gt;
&lt;br /&gt;
不过鉴于胡适宜先生的这本书并不是那么新，因此现在的业界观点是否改变并不好说，但偶数年还是以她的观点为依据的。&lt;br /&gt;
&lt;br /&gt;
顺道就补充一下无融合生殖咯：[[无融合生殖]]&lt;br /&gt;
&lt;br /&gt;
====请问次生虫媒传粉是什么东西（2016年联赛的解析里提到，垂柳是次生虫媒传粉，但没找到资料）====&lt;br /&gt;
&lt;br /&gt;
解答：参见杨柳科的系统发育，杨柳科的祖征是风媒传粉，而部分柳的虫媒传粉其实是其独立进化出的衍征，与被子植物的原始（初生）虫媒不同，自然可称为次生的虫媒传粉。&lt;br /&gt;
&lt;br /&gt;
====为什么有些植物的花是闭花授粉，但授粉完成后还会开放呢？(如豌豆)====&lt;br /&gt;
&lt;br /&gt;
我结合了手头有的书本、我自己的想法以及DS的帮助，个人觉得可能有以下几点原因：&lt;br /&gt;
*&#039;&#039;&#039;基因备份机制&#039;&#039;&#039;：虽然豌豆通过闭合花蕾完成自花授粉，但开放花朵仍保留一定的异花授粉潜力。这种冗余设计在极端环境（如花粉败育）下可引入外来基因，避免种群灭绝。&lt;br /&gt;
*&#039;&#039;&#039;生态信号传递&#039;&#039;&#039;：开放花朵释放挥发性萜类物质（如β-石竹烯），吸引捕食性昆虫控制蚜虫种群；成熟豆荚借助开放花瓣的视觉信号（黄色素反射550nm波长），提示食果动物采集传播。&lt;br /&gt;
*&#039;&#039;&#039;祖先特征残留&#039;&#039;&#039;：与豌豆亲缘关系较近的物种大多是开花后依赖昆虫异花授粉，可能豌豆的自花授粉形状是独立进化出的，但仍然保留了开花的特征&lt;br /&gt;
&lt;br /&gt;
提醒：这只是个人不成熟的猜想，由于资料有限，不能保证回答的百分百正确。如果有确凿的证据或者本回答有错误，欢迎补充与指正&lt;br /&gt;
&lt;br /&gt;
后人补充：本人教练曾经指出如下猜想（来源不明）：豌豆的祖先可能是异花授粉的，这时它有鲜艳的，开放的花；而在进化中异花授粉的性状丢失，代之以闭花授粉，开放的鲜艳的花性状是保留的。换言之，授粉完成后还会开放的性状或为一种遗痕性状。&lt;br /&gt;
&lt;br /&gt;
感谢回答🙏，根据我在马《植物学》386页看到的内容：稻、小麦虽然有成套的风媒传粉机制，但是大多数却是自花授粉的，这是因为人类几千年以来的选育，以结实为保障造成的，而这种情况在虫媒传粉的植物中也能见到，如豌豆、蚕豆。它们的花结构其实是适应虫媒传粉的&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;外生菌根、内生菌根和内外生菌根到底哪个（哪些）会侵入细胞原生质体？&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
据gyf所说，&#039;&#039;&#039;均不会&#039;&#039;&#039;。内生菌根仅为穿透细胞壁，与&#039;&#039;&#039;细胞质膜内陷&#039;&#039;&#039;形成的共生界面进行物质交换，并未穿透细胞膜。（貌似与大部分观点冲突）&lt;br /&gt;
&lt;br /&gt;
=== 动物学 ===&lt;br /&gt;
&lt;br /&gt;
==== 同上书 P354讲苔藓动物胃绪(funiculus)时提到它由“间质细胞 ”形成，这与《普通动物学》等所讲（由体腔上皮形成）是否相违背？（虽然还是小细节） ====&lt;br /&gt;
首先搞清楚实质细胞和间质细胞的定义，这个组织或器官里面起功能的叫实质细胞，辅助功能的叫间质细胞，体腔上皮是一个组织，一个组织里面本来就有实质细胞和间质细胞。假定这里说的是体腔上皮细胞（实质细胞），那这俩本来不就挨在一起吗，还是一样的。看不出有什么冲突的点。&lt;br /&gt;
&lt;br /&gt;
另外形态学的观点，看着在哪就是哪，这种在一起的结构本来就说啥的都有。如果真想知道从哪里来可以自己做转录组和细胞谱系分析，虽然这也多半得到的结果是很迷惑，除了肝细胞、血细胞、生殖细胞，其它细胞的谱系都不是很清楚。&lt;br /&gt;
&lt;br /&gt;
==== 关于弓鳍鱼的鳞片：《普通动物学》“圆形硬鳞”；杨安峰《脊椎动物学》前后分别提到是圆鳞和硬鳞。应是哪个？ ====&lt;br /&gt;
（这个网站竟然SSL证书过期了，导致只能用Markdown编辑，气）题主竟然还有上古书籍杨安峰脊椎动物，正好我也有，那就回答一下吧。应该是&#039;&#039;&#039;硬鳞&#039;&#039;&#039;。首先可以去搜维基百科，因为不太会用Markdown就不放链接了，直接搜弓鳍鱼的词条即可，是硬鳞。题主所说的圆鳞估计来自于杨安峰P84吧，上面说的多鳍鱼目是圆鳞或硬鳞，但是在弓鳍鱼目明确指出了是硬鳞。普通动物学圆形硬鳞本质也是硬鳞。&lt;br /&gt;
话说什么时候这个网站才能恢复https访问，现在编辑起来好麻烦。&lt;br /&gt;
&lt;br /&gt;
==== 来自刘凌云《普通动物学》：P221上方表明十腕目左侧第5腕特化为茎化腕，而下方却说右侧。到底为哪一侧？ ====&lt;br /&gt;
任淑仙《无脊椎动物学》第二版p180:多数种类左侧（少数为右侧）第五腕，目前遇到的考试题大多表述为左侧第五腕，或许不严谨但一般也不算错&lt;br /&gt;
&lt;br /&gt;
随手补一点：&lt;br /&gt;
&lt;br /&gt;
十腕目：&lt;br /&gt;
&lt;br /&gt;
旋壳乌贼科：第五对腕均茎化&lt;br /&gt;
&lt;br /&gt;
乌贼科：左侧第五腕&lt;br /&gt;
&lt;br /&gt;
后耳乌贼科：左侧第五腕&lt;br /&gt;
&lt;br /&gt;
耳乌贼属：左侧第一腕&lt;br /&gt;
&lt;br /&gt;
僧头乌贼属：第一对腕均茎化&lt;br /&gt;
&lt;br /&gt;
微鳍乌贼科：第五对腕均茎化&lt;br /&gt;
&lt;br /&gt;
枪乌贼科：左侧第五腕茎化&lt;br /&gt;
&lt;br /&gt;
狭乌贼属：右侧第五腕茎化&lt;br /&gt;
&lt;br /&gt;
八腕目：&lt;br /&gt;
&lt;br /&gt;
十字蛸科：第一对腕均茎化&lt;br /&gt;
&lt;br /&gt;
单盘蛸科：右侧第三腕茎化&lt;br /&gt;
&lt;br /&gt;
章鱼科：右侧第三腕茎化&lt;br /&gt;
&lt;br /&gt;
船蛸科：左侧第三腕茎化&lt;br /&gt;
&lt;br /&gt;
以上只是列举几个例子，可见头足目茎化腕的情况，变化还是非常大的。不过整体而言，十腕左五八腕右三的规律是确切无疑的，普动可能是写错了。&lt;br /&gt;
&lt;br /&gt;
有些地方写第四对，是因为不把位于第四对的触腕看作腕，第五对茎化腕就成了第四对。&lt;br /&gt;
&lt;br /&gt;
以上信息来源十分古早，分类地位很可能改变，仅供娱乐，莫要上心。参考资料：张玺，齐钟彦，《贝类学纲要》，1961.&lt;br /&gt;
&lt;br /&gt;
==== 目前较为流行的动物学分类大致情况？（分蜕皮动物与冠轮动物的那一版） ====&lt;br /&gt;
[[文件:动物系统进化树.jpg|缩略图]]&lt;br /&gt;
→见右图&lt;br /&gt;
&lt;br /&gt;
（答主的图貌似有点老了，螺旋卵裂还全是未解决）&lt;br /&gt;
&lt;br /&gt;
现在螺旋卵裂分为有颚动物超门和扁虫冠轮动物两大支：&lt;br /&gt;
&lt;br /&gt;
①有颚动物超门包括颚口、微颚、轮虫、棘头四个原本在普动上写过的门（轮虫和棘头是一支，轮虫是个并系群，棘头成了轮虫下的一个目），毛颚动物目前可能要和有颚并到一支。&lt;br /&gt;
&lt;br /&gt;
②扁虫冠轮动物分出两支，一支归扁虫，一支归冠轮（像是废话），扁虫动物基部分支是中生动物（妹想到吧），之后的扁形动物和腹毛动物为姐妹群。&lt;br /&gt;
&lt;br /&gt;
③冠轮动物又进一步分为了两大支，一支是环节动物，有原本的多毛寡毛和蛭，还加上了星虫螠虫和西伯达虫，具体分的太乱，就不搞了，圆环动物门成了冠轮底下的未解决；&lt;br /&gt;
&lt;br /&gt;
④另一支分出软体动物和Kryptotrochozoa，翻译叫“氪金动物”（樂），包括触手冠动物（下分：腕足动物，含原腕足动物门和帚虫动物门；苔藓动物，含原内肛动物门及外肛动物门）和纽虫。&lt;br /&gt;
&lt;br /&gt;
——指正：Kryptotrochozoa应当翻译为“隐担轮动物”，希腊语kryptos代表隐藏的，Trochozoa代表担轮幼虫（trochophore larvae），即其幼虫是“隐藏的担轮幼虫”——发生改变但本质仍是担轮幼虫的辐轮幼虫(帚虫)、帽状幼虫(纽虫)、双壳幼虫(腕足)等等。&lt;br /&gt;
[[文件:目前基本公认的进化树.png|缩略图]]&lt;br /&gt;
（以上内容源自维基百科，其中一些分类群的定义尚有争议，但大致没错）&lt;br /&gt;
&lt;br /&gt;
==== 《无脊椎动物学》中写缠绕刺丝囊(spirocyst)仅珊瑚纲具有，但《普动》上写水螅具有卷缠刺丝囊(没写英文)，所以这两者是一个东西吗？如果不是，有什么区别？谢谢 ====&lt;br /&gt;
是一个东西，就是仅卷缠或分泌粘液，和穿刺刺丝囊区分&lt;br /&gt;
&lt;br /&gt;
==== 哪些无脊椎动物的血红（或血蓝之类）蛋白在血浆中，哪些又在血细胞中？ ====&lt;br /&gt;
非常值得总结的内容！敬请期待：[[有关呼吸色素的总结]]&lt;br /&gt;
&lt;br /&gt;
==== 青蛙如何分辨用于求偶的高频声音和用于警告的低频声音，它的听觉器官只为一个听斑，与行波理论不符？ ====&lt;br /&gt;
[[文件:Answer.png|左|缩略图|我就说翻译些外文教材有用]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
链接：[[第十七章 感觉器官]]&lt;br /&gt;
&lt;br /&gt;
==== 对报警外激素反应最强烈的工蜂年龄 ====&lt;br /&gt;
响应报警外激素的工蜂，接下来很可能在应对外敌的战斗中牺牲，所以垂垂老矣的老年工蜂会积极反应，而年少的工蜂还“大有可为”，不值得牺牲，响应就弱。&lt;br /&gt;
&lt;br /&gt;
==== 什么是初生颌关节？和初生颌有什么关联？ ====&lt;br /&gt;
初生颌关节指方骨与关节骨之间（或腭方与麦氏之间）的，上下颌之间的关节。与之相对应的是哺乳类的齿骨与鳞骨之间形成的次生颌关节。&lt;br /&gt;
&lt;br /&gt;
而初生颌是指软骨鱼和某些基部硬骨鱼那样的麦氏软骨与腭方软骨起主要功能的颌，与之相对的是上下颌功能被加入的膜原骨替代的次生颌，起功能的骨头有前颌骨、上颌骨、齿骨、隅骨。&lt;br /&gt;
&lt;br /&gt;
==== 关于鸵鸟膀胱的类型：鸵鸟的膀胱是泄殖腔膀胱还是尿囊膀胱？ ====&lt;br /&gt;
不能想当然地认为是尿囊膀胱，鸵鸟的泄殖腔分为三个部分，粪道、泄殖道和肛道，粪道连接直肠，泄殖道有输尿管和生殖管开口，肛道开口于体外，背面有腔上囊；鸵鸟的泄殖道可以储存大量尿液，起到类似其他羊膜动物的膀胱的作用，因此严格来说鸵鸟也没有膀胱，不过书上还是普遍认为鸵鸟具有膀胱，那么就按来源属于泄殖腔膀胱。 &amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt; &amp;lt;ref name=&amp;quot;:1&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==== 关于鱼类鳔体积调节与悬浮水层高度的问题：《比解》上明确写了当鱼稳定在深水层时，鳔内气体需要减少，而稳定在浅水层时需增加鳔内气体但是深水层中水压较大，压缩鱼体体积，减小浮力，鱼想要稳定在该水层中应当增加浮力才对，为何排气而非增加气体？====&lt;br /&gt;
你推理的是正确的，书上写错了。&lt;br /&gt;
&lt;br /&gt;
==== 两栖动物的肺是否能认为其具有肺泡？ ====&lt;br /&gt;
不能&lt;br /&gt;
&lt;br /&gt;
==== 北斗的题库中提到的“角手冠”是什么东西？ ====&lt;br /&gt;
疑似触手冠打错&lt;br /&gt;
&lt;br /&gt;
====为什么海鞘作为水生生物排泄物却是尿酸？====&lt;br /&gt;
&lt;br /&gt;
普动上是这么写的，但是姚yz告诉我们应该改成氨，和正常的水生生物一样。&lt;br /&gt;
&lt;br /&gt;
====蜜蜂访问豌豆花先接触那片花瓣====&lt;br /&gt;
&lt;br /&gt;
应该是先访问旗瓣。旗瓣位于最上方，是最大的一片花瓣，较为显眼，且通常具有吸引昆虫的颜色和斑纹。蜜蜂在寻找花蜜时，会首先被旗瓣吸引，落在旗瓣上。之后，蜜蜂为了获取花蜜，会继续向内深入，进而接触到翼瓣和龙骨瓣，在这个过程中完成授粉。&lt;br /&gt;
&lt;br /&gt;
====比较解剖书225页，图上好像髂动脉和股动脉画反了====&lt;br /&gt;
已经在[[教材错误与矛盾]]&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;能不能把鱼的分类整理一下&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
可在此查询，但可能要科学上网打开内部wiki链接[https://www.inaturalist.org/taxa/47178-Actinopterygii]&lt;br /&gt;
&lt;br /&gt;
等人补充一下软骨鱼分类&lt;br /&gt;
&lt;br /&gt;
=== 生物化学 ===&lt;br /&gt;
&lt;br /&gt;
==== dna与rna谁的密度大： ====&lt;br /&gt;
RNA的密度最大。&lt;br /&gt;
&lt;br /&gt;
DNA、RNA和蛋白质这三种生物大分子都具有一定的密度，其中&#039;&#039;&#039;RNA的密度最大&#039;&#039;&#039;，蛋白质的密度最低，DNA的密度介于两者之间的某一个位置。 一个特定的DNA分子的密度主要取决于它的GC含量和构象状态。 GC含量越高，密度越大。 与超螺旋结构存在的DNA密度显然要高于松弛状的DNA。 而变性的DNA密度要高于没有变性的DNA。&lt;br /&gt;
&lt;br /&gt;
附：“不同大分子的浮力密度也不同。DNA一般在1.7以上，RNA为1.6，蛋白质为1.35-1.40”此应为王镜岩第三版的错误，其第四版与比较新的教材已更正&lt;br /&gt;
&lt;br /&gt;
==== 多不饱和脂肪酸的氧化过程？ ====&lt;br /&gt;
有点意思哈~右边请！[[多不饱和脂肪酸的氧化]]&lt;br /&gt;
&lt;br /&gt;
==== 酶活力单位的定义是否有问题？ ====&lt;br /&gt;
误解主要从“所需”两字产生，删掉就好理解了。实际上就是一个速率，底物转化质量比时间m/t，只不过把这个速率用来表示酶量。比如1min这些酶（不管多少酶不管什么酶）转化了1μmol底物，那这些酶的量就是1U。相应的，如果1min这些酶转化了2μmol底物，那这些酶的量就是2U。实际上和底物相关，但是用于表示酶量。所以此“所需”非彼“所需”。在1min内转化1μmol底物需要1U酶，在1min内转化2μmol底物需要2U酶，没什么问题。至于提到的国内按什么来，国内外都是统一的，是国际酶学会订的（虽然现在酶学会更推荐用kat这个单位），做过实验动手算过就明白了。&lt;br /&gt;
&lt;br /&gt;
==== from徐长法《生物化学》下册p90，真的有无脊椎动物体内存在乙醛酸循环吗？ ====&lt;br /&gt;
解答：有。乙醛酸循环是植物和某些微生物（大肠杆菌、醋酸杆菌等）及一些无脊椎动物细胞内脂肪酸氧化分解为乙酰CoA之后，在乙醛酸循环体(glyoxysome)内生成琥珀酸、乙醛酸和苹果酸的过程。参见[https://baike.baidu.com/item/%E4%B9%99%E9%86%9B%E9%85%B8%E5%BE%AA%E7%8E%AF/619160 百度百科]（百度百科内容不一定正确，请辩证对待）&lt;br /&gt;
除了具有双功能融合 ICL-MS 基因的线虫，其他后生动物无。[https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1630690 后生动物乙醛酸循环酶的进化]&lt;br /&gt;
&lt;br /&gt;
==== 求一个关于金属酶/金属蛋白的整理。比如质膜ATP酶以Na为辅酶，精氨酸酶以Mn作为辅酶等等 ====&lt;br /&gt;
解答：先写了一点点。可以参考[https://zh.wikipedia.org/zh-hans/金属蛋白 金属蛋白]&lt;br /&gt;
&lt;br /&gt;
==== 所以反竞争性抑制剂有啥应用实例 ====&lt;br /&gt;
现实中几乎没有反竞争性抑制剂（见杨荣武生物化学原理），反竞争性抑制剂仅存在理论研究价值。&lt;br /&gt;
杨sir这里写的大概的确有问题：多见于多底物发生的生化反应中，在单一底物的酶促反应中不常见，例如L-同型精氨酸和L-苯丙氨酸等多种L-氨基酸是碱性磷酸酶的反竞争性抑制剂，它们能结合碱性磷酸酶与底物的复合物，并阻碍反应继续进行；此外，肼类化合物反竞争性抑制胃蛋白酶的活性，氰化物也是芳香硫酸酯酶的反竞争性抑制剂。&lt;br /&gt;
参考&lt;br /&gt;
SPECTOR T, HAJIAN G．Statistical methods to distinguish competitive, noncompetitive, and uncompetitive enzyme inhibitors．Analytical biochemistry，1981，115(2)：403-409．DODGSON K S, SPENCER B, WILLIAMS K．Examples of Anti-competitive Inhibition．Nature，1956，177(4505)：432-433．&lt;br /&gt;
《中国大百科全书》第三版网络版&lt;br /&gt;
&lt;br /&gt;
==== 为何盐析使用硫酸铵而非氯化钠氯化钾等？ ====&lt;br /&gt;
早期生物学家在做实验的时候发现有盐析现象，于是去找适合盐析的盐。找到最后觉得硫酸铵最好。当然不一定用硫酸铵，这个都取决于个人。毕竟盐析推荐用中性盐但是硫酸铵明显是个酸性盐但照样用。当然可以用氯化钠什么的但是效果不一定好（在家里可以把食盐撒到鸡蛋清上能看到有白色絮状沉淀）。这取决于盐的性质和待处理蛋白质的性质，有很大的多样性。&lt;br /&gt;
&lt;br /&gt;
补：今天遇到了段志贵教授，他告诉我另外一个点：硫酸铵溶解度非常大。&lt;br /&gt;
&lt;br /&gt;
话说这个问题背后的知识点还是比较复杂的。我讲两句。（咳）&lt;br /&gt;
&lt;br /&gt;
电荷密度高的离子，结合水分子的能力强，被称为“亲液的”Kosmotropic。&lt;br /&gt;
&lt;br /&gt;
电荷密度低的离子，就被称为“离液的”Chaotropic 。&lt;br /&gt;
&lt;br /&gt;
像磷酸根，硫酸根这样的多价离子，电荷多，电荷密度高，就是亲液剂；像碘离子、硫氰酸根离子，不光电荷少，分子还大，电荷密度低，就是离液剂。&lt;br /&gt;
&lt;br /&gt;
从亲液性强的排列到离液性强的离子，就成了Hofmeister序列。&lt;br /&gt;
&lt;br /&gt;
至少看起来，阳离子离液剂+阴离子亲液剂=盐析+不变性（SO&amp;lt;sub&amp;gt;4&amp;lt;/sub&amp;gt;&amp;lt;sup&amp;gt;2-&amp;lt;/sup&amp;gt;+NH&amp;lt;sub&amp;gt;4&amp;lt;/sub&amp;gt;&amp;lt;sup&amp;gt;+&amp;lt;/sup&amp;gt;），阴离子离液剂+阳离子亲液剂（SCN&amp;lt;sup&amp;gt;-&amp;lt;/sup&amp;gt;+胍）=盐溶+变性。&lt;br /&gt;
[[文件:Hofmeister serie.png|缩略图]]&lt;br /&gt;
这解释了为什么盐析用硫酸铵，而变性用异硫氰酸胍。显然这里面也有着成本、溶解性、避免形成难溶的沉淀物之类的考量。&lt;br /&gt;
&lt;br /&gt;
至于为什么，我的理解如下：蛋白质多为阴离子：&lt;br /&gt;
&lt;br /&gt;
* 如果阳离子为离液剂，此阳离子不愿结合水，反而会结合蛋白质：&lt;br /&gt;
** 蛋白质分子结合了相同的离子，相互排斥，不易沉淀，造成盐溶&lt;br /&gt;
** 结合了在蛋白质上的离子破坏了蛋白质的氢键，造成变性&lt;br /&gt;
* 如果阳离子是亲液剂，此阳离子希望结合水，便不管蛋白质：&lt;br /&gt;
** 水分子都被亲液剂结合，蛋白质缺水沉淀，造成盐析&lt;br /&gt;
** 蛋白质不会受到离子的影响，不会变性&lt;br /&gt;
* 如果阴阳离子都是亲液剂，阴阳离子互相结合而不结合水，减小总体亲液效果。&lt;br /&gt;
* 如果阴阳离子都是离液剂，阴阳离子不互相结合反而都去结合水，减小总体离液效果。&lt;br /&gt;
&lt;br /&gt;
以上是我个人的理解，不一定对，但肯定能够帮你记住这些规律😋&lt;br /&gt;
&lt;br /&gt;
==== b族维生素的组成明析 / vb8是肌醇还是腺嘌呤核苷酸  或者“生物素”（科普中国说的，笑） ====&lt;br /&gt;
[[文件:B族维生素.png|缩略图|B族维生素解析]]&lt;br /&gt;
见右侧图“B族维生素解析”&lt;br /&gt;
&lt;br /&gt;
注：此图为朱斌《生物竞赛专题精炼》P100，题主可自己看。另外这些都有争议，朱斌这里只是观点之一。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;沙林毒气的作用机理？（之前有看到说它是乙酰胆碱酯酶的自杀型抑制剂，但没有找到别的资料）&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
杨rw《生物化学原理》第三版p170  沙林即甲基氟磷酸异丙酯，是一种有机磷化物，可以共价修饰酶活性中心的丝氨酸残基的羟基使得其失活。沙林属于基团特异性抑制剂&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;Yang Sir的书上说“嘌呤环的嘧啶环和咪唑环之间有小的弯曲，故嘌呤环不完全在一个平面上”，但是根据本人浅薄的化学知识，C5和C4应当都是sp2杂化，为什么会出现弯曲呢（话说这是不是已经不是生物的范畴了）&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
环张力与键角矛盾 六元环的理想键角为120°，而五元环的理想键角约为108°。当两个环在C4和C5处稠合时，连接处的键角需要兼顾两种环的需求，导致局部键角偏离理想值（如压缩或拉伸），从而引发整体结构的扭曲。&lt;br /&gt;
共轭受限与定域化效应  尽管sp²杂化原子通常通过π共轭保持平面性，但在嘌呤中，五元环与六元环的共轭体系可能不完全连续。咪唑环的部分双键定域化（如C4-C5键的单双键特性交替），削弱了共轭的连续性，允许一定程度的弯曲。&lt;br /&gt;
孤对电子排斥与杂原子影响  嘧啶和咪唑环中的氮原子孤对电子占据不同杂化轨道（如嘧啶环的N1、N3为sp²杂化，咪唑环的N7、N9可能参与不同键合）。这些孤对电子的空间排斥可能进一步破坏平面性。&lt;br /&gt;
实验证据支持  X射线晶体学数据显示，嘌呤分子中嘧啶环与咪唑环之间存在约5°~10°的轻微弯曲（如咖啡因等衍生物），证实了结构的非完全平面性。这种弯曲在溶液中因分子振动可能更加显著。&lt;br /&gt;
&lt;br /&gt;
==== 根据周德庆《微生物学教程》，磺胺类药物抑制二氢蝶酸合成酶，但貌似一直说的是二氢叶酸合成酶，是一直说的都是错的吗？ ====&lt;br /&gt;
是的，确实是抑制二氢蝶酸合成酶。此内容也得到《微生物生物学》（霍乃蕊，余知和）的支持。&lt;br /&gt;
&lt;br /&gt;
====异亮氨酸与α螺旋的破坏关联性强不强====&lt;br /&gt;
&lt;br /&gt;
据北斗王娜所说是有的（侧链较大），但未在国内主流教材上看到该说法&lt;br /&gt;
&lt;br /&gt;
====如果说双缩脲反应的基础是两个肽键，那么假设一个氨基酸与一个酰胺氨基酸（如A-N）可以和双缩脲有颜色反应吗====&lt;br /&gt;
&lt;br /&gt;
不可以，两个氨基甲酰基不是连着的&lt;br /&gt;
&lt;br /&gt;
====卤水主要成分是氯化镁氯化钙，石膏的主要成分是硫酸钙，那为什么石膏豆腐用碱变性使蛋白质沉淀，而卤水豆腐是盐析原理呢？====&lt;br /&gt;
&lt;br /&gt;
卤水点豆腐很好解释，因为氯化镁和氯化钙的溶解度通常较高（CaCl₂溶解度为74.5g/100g水，25℃），在溶液中可以快速释放出大量二价阳离子，电荷中和效应显著，同时氯化镁是强酸弱碱盐，其溶液通常呈弱酸性（pH≈5.5-6.0），并不能完成碱变性&lt;br /&gt;
&lt;br /&gt;
而对于硫酸钙来说，其溶解度较低，CaSO₄的Ksp=4.93×10⁻⁵，在纯水中最大Ca²⁺浓度仅0.015M，无法达到盐析阈值（0.1M），因而需要碱变性处理蛋白质。但由于硫酸钙的水溶液呈中性，所以生产上要利用其他物质将溶液的pH调至碱性以使得蛋白质能够有效变性&lt;br /&gt;
&lt;br /&gt;
==== 胆固醇合成需要几个nadph？ ====&lt;br /&gt;
&#039;&#039;&#039;16个NADPH&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==== 杨Sir生化的胆固醇合成那里写到，在HMG-CoA形成之后的所有反应都在光面内质网上进行，那么为什么419又说“鲨烯合成好之后，由于不溶于水，因此需要细胞质基质中的固醇载体蛋白将其转运至内质网”？ ====&lt;br /&gt;
催化的酶在内质网膜上，活性位点在胞质面。鲨烯之后底物也跑到膜上去了。&lt;br /&gt;
&lt;br /&gt;
=== 分子生物学 ===&lt;br /&gt;
&lt;br /&gt;
==== 想求证一下，“DNA复制执照因子假说”中“执照”因子主要成分是Mcm蛋白，这是否是那种DNA解旋酶？毕竟好像在信号通路那里曾出现过一个不是后期促进复合物的APC。 ====&lt;br /&gt;
解答：单说Mcm应该是同一个家族。真核生物DNA复制所用到的Mcm2-10同时负责调控复制启动，Mcm不结合DNA也不会开始复制。关于Mcm是否是执照因子的讨论见下：&lt;br /&gt;
&lt;br /&gt;
一个异议：杨荣武《生物化学原理》3rd中，执照因子应是Cdt10和Cdc6，这两者在之后的复制过程被回收或降解。在丁明孝.等《细胞生物学》5th中，细胞周期一章的图中，有对Cdt10和Cdc6的标注，并且和杨荣武书上的过程一致，因此，如果杨荣武改题，这个知识点可能会出现极大争议。&lt;br /&gt;
&lt;br /&gt;
↑杨荣武分子生物学第二版说执照因子是Cdt1和Cdc6，至于是否包括Mcm，杨sir没有正面回答这个问题，仅说明这两种蛋白会首先结合Mcm。不过按照pre-RC的定义，应该不包括Mcm。联赛假如出了建议按杨sir来，因为他可以改题。&lt;br /&gt;
&lt;br /&gt;
==== 来自杨荣武《分子生物学》:DNAP4被用作修复，且在正常生长时被诱导合成，那么为何它“易错”？ ====&lt;br /&gt;
DNAPIV合成效率不高，本来就是修复用的。易错可以引入更多突变，提高细胞生存率，并且参与SOS途径。SOS的时候细胞都快死了，哪还会在乎这点错误。&lt;br /&gt;
&lt;br /&gt;
==== 杨sir的分生第二版P216图6-6“RecBCD酶在同源重组中的作用”中，文字是“5&#039;-外切酶”但图看起来是核酸内切酶，请问应如何理解；以及杨sir在学堂在线上讲的分生课程讲的是RecBCD先同时发挥3&#039;-外切酶与5&#039;-外切酶活性，遇到χ序列后解链酶活性被激活，但他的《分子生物学（第二版）》讲的先发挥解链酶与3&#039;-外切酶活性，遇到χ序列后再发挥“5&#039;-外切酶（？）”活性，请问应参考哪种说法？ ====&lt;br /&gt;
集训时问了杨荣武，他说按学堂在线上说的来（即“RecBCD先同时发挥3&#039;-外切酶与5&#039;-外切酶活性，遇到χ序列后解链酶活性被激活”）。&amp;lt;small&amp;gt;同时杨sir透露他的分生要开始编新版（&amp;lt;/small&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==== RecBCD是否具有5’外切酶活性，各大教材措辞不同。 ====&lt;br /&gt;
杨sir本人说有（见上一条）&lt;br /&gt;
&lt;br /&gt;
=== 细胞生物学 ===&lt;br /&gt;
&lt;br /&gt;
==== from 徐长法《生物化学》下册p153，“不同蛋白O-糖基化的起始起点并不一致，有的在内质网，有的在内质网-高尔基体中间结构，也有的在内侧高尔基体”，这句话准确吗？也就是说不是像翟中和《细胞生物学》那样只在高尔基体进行吗？ ====&lt;br /&gt;
解答：这似乎是一个&amp;quot;有争议&amp;quot;的问题。观点一：①如题，但徐长法我没有看过不做评价（我看的是杨sir和王镜岩QwQ，大佬有看过的可以验证一下）。②有[https://zhuanlan.zhihu.com/p/213786542 这篇知乎文章]描述O-linked为大多发生在内质网，黏蛋白发生在高尔基体（这篇文章给出了参考文献，可以自行验证）。观点二：①翟中和描述的是N-linked在内质网和高尔基体发生，O-linked在高尔基体发生（但是他没有给出肯定的判断）。②杨sir分子生物学第二版P393说O-linked只发生在高尔基体，一个很直接的结论。个人认为应该只在高尔基体，因为相关的糖基转移酶分布在高尔基体上。（而且杨sir能改题，直接信杨sir啊）至于其它观点不知从何而来。至少我目前做过的题都是按照高尔基体来的。&lt;br /&gt;
&lt;br /&gt;
补充一下答主的回答：其实O-linked在胞质也可进行（非典型O-linked，由N-GlcNAc连接至Ser上而成，这在丁明孝.等《细胞生物学》5th中有进行描述），而且不典型的/非翟中和的O-linked有很多形式，按糖的种类分可以包括O-GalNAc、O-GlcNAc、O-Gal、O-Man、O-Fuc、O-Glc，后三种在维基百科中提到了，而且这三种是在内质网进行的（O-Man是在内质网起始，在高尔基体完成），因此，说在内质网应该是OK的。&lt;br /&gt;
&lt;br /&gt;
另外，朱斌还在他的书里写过Tyr的“O-linked”，杨荣武也曾在讲课的时候提到蛋白聚糖的“O-linked”，总之说法很多，有很多可拓展之处。（我把维基百科扒下来了，PDF自取：[[:文件:O-linked glycosylation.pdf|O-linked glycosylation---Wikipedia]]）&lt;br /&gt;
&lt;br /&gt;
==== P62提到ABC超家族用于转运分子，而P66又说CFTR属于ABC超家族，是否矛盾？ ====&lt;br /&gt;
解答：应该是翟中和的问题，他想说的小分子是小物质的意思，不是分子的意思。离子也可以。ABC超家族是很大一类蛋白，基本上什么类型的物质都能转运。（似乎CFTR在效果上是是一个需要用ATP开启的离子通道蛋白，结构上属ATP超家族）&lt;br /&gt;
&lt;br /&gt;
追问：ATP超家族又是啥ʕ•̫͡•ʔ&lt;br /&gt;
&lt;br /&gt;
解答：就是ABC超家族，ATP binding cassette superfamily.&lt;br /&gt;
&lt;br /&gt;
==== 癌细胞体外培养是否贴壁？ ====&lt;br /&gt;
不贴壁、无接触抑制（后者为前者原因，二者同为癌细胞区别于正常细胞的现象）&lt;br /&gt;
&lt;br /&gt;
这话说的，意思是癌细胞可以被悬浮培养吗？大概不能。一般的癌细胞最开始也是贴壁长成一层，只不过长满一层后不会接触抑制，会继续长成好几层。&lt;br /&gt;
&lt;br /&gt;
==== 鞘脂的合成部位（sER or Golgi&#039;&#039;&#039;）&#039;&#039;&#039; ====&lt;br /&gt;
详见[https://www.dxy.cn/bbs/newweb/pc/post/44006920 鞘脂]&lt;br /&gt;
&lt;br /&gt;
——神经酰胺在sER上合成，再转到高尔基体上合成鞘脂。&lt;br /&gt;
&lt;br /&gt;
==== 想问一下，真核生物的核糖体还有E位点吗？ ====&lt;br /&gt;
解答：有E位点。详见视频：https://www.bilibili.com/video/BV19w4m127QK/?spm_id_from=333.337.search-card.all.click&amp;amp;vd_source=86f4f9d6f47b1620e6f209f2a952173f&lt;br /&gt;
&lt;br /&gt;
==== 来自丁明孝.等《细胞生物学》5th：为何此书上写CFTR突变体是&amp;quot;gain of function&amp;quot;? ====&lt;br /&gt;
解答:个人见解,应为编辑错误，翟好像并未严格区分逗号与分号大小问题，分号中间的逗号改为句号即可理解&lt;br /&gt;
&lt;br /&gt;
====联会复合体的装配起始在什么时候？====&lt;br /&gt;
&lt;br /&gt;
偶线期，经过粗线期，在双线期解体&lt;br /&gt;
&lt;br /&gt;
====观察样品中酶活及其分布用何种包埋？====&lt;br /&gt;
&lt;br /&gt;
答：根据王金发编写的《细胞生物学实验指南》大概是冷冻包埋，但是我手边没这本书，等等我。&lt;br /&gt;
&lt;br /&gt;
==== 间体（中膜体，拟线粒体）存在于活细胞中吗，还是只是死细胞中人为造成的结构。关于这个问题有好多说法，找不到最新的文献解释 ====&lt;br /&gt;
人为造成，但重复性良好所以被误解很多年。详情请看The Very Reproducible (But Illusory) Mesosome&lt;br /&gt;
&lt;br /&gt;
==== 求个CAR-T疗法历史的总结。 ====&lt;br /&gt;
[https://zhuanlan.zhihu.com/p/377677021 CAR-T发展历史及展望 - 知乎]&lt;br /&gt;
&lt;br /&gt;
=== 生理学 ===&lt;br /&gt;
&lt;br /&gt;
==== 关于不同离子转运蛋白耗能多少及转运离子数量的总结？ ====&lt;br /&gt;
刚刚写了一点点，还有好多好多内容需要补充→&#039;&#039;&#039;[[载体蛋白和通道蛋白]]&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==== 朱大年《生理学》第九版P295表格中提到本体感觉属于Aα型神经纤维，但是P325却提到肌梭的传入神经包括Ia和II类纤维，其中花枝末梢是II类纤维的末梢且负责本体感觉。已知II类纤维属于Aβ类纤维，前后是否矛盾？John G. Nicholls等《神经生物学》第五版也有肌梭Ia型和II型纤维分别是“动态”和“静态”的传入纤维，是否可类比“肌梭长度感觉”和“本体感觉”？那朱P295表格是否表述不妥？ ====&lt;br /&gt;
解答：ABC和 I II III IV是分别两个分类系统，其中ABC多用于传出纤维的分类，I II III IV 多用于传入纤维的分类（不绝对，多用于而已）这个地方就是Aα为支配梭外肌传出纤维、初级肌梭传入纤维（本体感觉）。题主所表述的II类纤维属于Aβ的表述是不妥的，因为根本不是一个分类系统。Aβ多为皮肤触压觉传入纤维。分类标准的话ABC主要按照传导速度，I II III IV主要按照纤维直径。关于分类[https://zhuanlan.zhihu.com/p/68321428 可见这里]，当然这些内容朱大年也写过。&lt;br /&gt;
&lt;br /&gt;
追问《生理学》关于肌梭的传入纤维：抽象的是朱大年的表格上把两种分类系统对比了一下说Aα对应Ia和Ib，Aβ对应II……&lt;br /&gt;
&lt;br /&gt;
解答：在肌紧张里面α运动神经纤维不就是Aα吗。首先注意朱大年是这么写的“I II III IV类纤维分别相当于Aα Aβ Aδ C类&#039;&#039;&#039;后根纤维&#039;&#039;&#039;，但又&#039;&#039;&#039;不完全等同&#039;&#039;&#039;”，所以先不要把两种分类混一起。Aα负责肌肉本体感觉应该是没有争议的。II类纤维朱大年只表述了“可能有关”。其实Ia类神经纤维也负责肌肉本体感觉。&lt;br /&gt;
&lt;br /&gt;
==== 哺乳动物成熟红细胞裂解后,正常小泡和外翻性小泡的形成过程 ====&lt;br /&gt;
解答：红细胞受低渗影响破裂形成血影（残留的膜骨架＋膜），膜重新闭合时可能形成正常小泡或外翻性小泡&lt;br /&gt;
&lt;br /&gt;
==== 关于血液湍流的发生以及此时的血液黏度和血流切率，个人感觉朱大年生理学P116-117上的说法有些矛盾（下列一二）====&lt;br /&gt;
# 在血液黏度低的时候容易形成湍流 &lt;br /&gt;
# 血流切率越高，层流现象越明显，即血流黏度较低；相反当血流切率较低的时候，血液黏度高&lt;br /&gt;
想问一下湍流发生的时候，血液黏度究竟是高是低？血流切率又是怎样的呢？谢谢！&lt;br /&gt;
朱大年教材中的两个表述并不矛盾，而是从不同角度描述：&lt;br /&gt;
黏度低易湍流：强调黏度对Re的直接影响（普遍规律）。&lt;br /&gt;
高切率→低黏度→层流明显：指在未达临界Re时，高切率下剪切稀化使层流更稳定；但若Re超过临界值（如高流速），仍会发展为湍流。&lt;br /&gt;
&lt;br /&gt;
==== 肾素和抗利尿激素的作用都是减少尿量，从而使循环血量增多即升高血压，但为什么抗利尿激素抑制肾素的分泌呢？ ====&lt;br /&gt;
类似负反馈，因为AngII促进ADH分泌&lt;br /&gt;
&lt;br /&gt;
==== 假设细胞内的钠离子浓度为12mM，细胞外为145mM，膜电位为-50mV，温度为37摄氏度，计算通过钠离子葡萄糖同向转运体所能达到的最大细胞内和细胞外葡萄糖浓度的比值是？A11.2 B8.69 C5940 D8690 ====&lt;br /&gt;
——和我的聚铑同学讨论了一下，他们算了很多遍都是6100多，这题的具体答案是什么？是4F吗？若果是的话再发具体解析吧--[[用户:MangoCat|MangoCat]]（[[用户讨论:MangoCat|留言]]） 2025年3月11日 (二) 19:22 (CST)&lt;br /&gt;
&lt;br /&gt;
@[[用户:MangoCat|MangoCat]]：6100多和5940差距只在四舍五入上，5940是lehninger教材上得出的答案（此题是lehninger书上的原题但原题是问答题），是在过程中就四舍五入取到ΔG11.2kj/mol了。解析mangocat来写吧。我懒。&lt;br /&gt;
&lt;br /&gt;
1.计算钠离子的电化学势能：&amp;lt;br&amp;gt;Δμ&amp;lt;sub&amp;gt;Na&amp;lt;/sub&amp;gt;=zFΔψ+RTln([Na&amp;lt;sup&amp;gt;+&amp;lt;/sup&amp;gt;]&amp;lt;sub&amp;gt;in&amp;lt;/sub&amp;gt;/[Na&amp;lt;sup&amp;gt;+&amp;lt;/sup&amp;gt;]&amp;lt;sub&amp;gt;out&amp;lt;/sub&amp;gt;)&amp;lt;br&amp;gt;带入数值:&amp;lt;br&amp;gt;z=1&amp;lt;br&amp;gt;F=96485C/mol&amp;lt;br&amp;gt;Δψ=-0.05V&amp;lt;br&amp;gt;R=8.314J/(mol·K)&amp;lt;br&amp;gt;T=310.15K&amp;lt;br&amp;gt;[Na&amp;lt;sup&amp;gt;+&amp;lt;/sup&amp;gt;]&amp;lt;sub&amp;gt;in&amp;lt;/sub&amp;gt;=12mM&amp;lt;br&amp;gt;[Na&amp;lt;sup&amp;gt;+&amp;lt;/sup&amp;gt;]&amp;lt;sub&amp;gt;out&amp;lt;/sub&amp;gt;=145mM&amp;lt;br&amp;gt;可得Δμ&amp;lt;sub&amp;gt;Na&amp;lt;/sub&amp;gt;=-11250J/mol&amp;lt;/br&amp;gt;&lt;br /&gt;
2.已知钠离子葡萄糖同向转运体以2:1的比例转运钠离子和葡萄糖。平衡时，钠离子释放的能量等于葡萄糖逆浓度梯度所需的能量：&lt;br /&gt;
&amp;lt;br&amp;gt;2Δμ&amp;lt;sub&amp;gt;Na&amp;lt;/sub&amp;gt;+Δμ&amp;lt;sub&amp;gt;Glc&amp;lt;/sub&amp;gt;=0&amp;lt;br&amp;gt;则带入计算可得:&amp;lt;br&amp;gt;Δμ&amp;lt;sub&amp;gt;Glc&amp;lt;/sub&amp;gt;=22500J/mol&amp;lt;/br&amp;gt;&lt;br /&gt;
3.又因为我们有：&lt;br /&gt;
&amp;lt;br&amp;gt;Δμ&amp;lt;sub&amp;gt;Glc&amp;lt;/sub&amp;gt;=RTln([Glc]&amp;lt;sub&amp;gt;in&amp;lt;/sub&amp;gt;/[Glc]&amp;lt;sub&amp;gt;out&amp;lt;/sub&amp;gt;)&amp;lt;br&amp;gt;所以带入数值&amp;lt;br&amp;gt;解得[Glc]&amp;lt;sub&amp;gt;in&amp;lt;/sub&amp;gt;/[Glc]&amp;lt;sub&amp;gt;out&amp;lt;/sub&amp;gt;=6156&lt;br /&gt;
&lt;br /&gt;
====关于折返激动，扑动，颤动等心律失常的介绍？====&lt;br /&gt;
折返激动是指一个激动下传后，又可沿着另一条途径回到原已兴奋的心肌所产生的异常激动。阵发性心动过速可理解为心房、房室结、房室间、心室内，由单源性折返激动回路引起有节律的快速心律失常。如心房折返速度更快打250-300次/分则为心房扑动。如折返速度更快并变得无序则为心房颤动（大于350次/分）。&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;病理生理学.2版.李桂源,吴伟康,欧阳静萍.人民卫生出版社&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;翟《细胞生物学》中提到紧密连接能形成渗透屏障，那为什么重吸收还存在细胞旁途径？&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
因为翟就在这句话下面提到了渗透屏障的相对性，举的就是肾小管的例子，一般认为这种渗漏由[https://zhuanlan.zhihu.com/p/497677014 Claudins]介导，其中Claduins2、7、10、15、16通过在紧密连接上形成空隙增加细胞旁阳离子的渗透性&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;视杆细胞持续的阳离子内流到底是钠离子通道介导还是非选择性阳离子通道介导？胞生上说是非选择性阳离子通道，但是生理学原理和动物生理学上说的是钠离子通道&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
你好！应该是cGMP门控通道，不属于Na离子通道，其能通过Ca，也不受TTX抑制。[https://pubmed.ncbi.nlm.nih.gov/2467600/ 参考文献][https://pubmed.ncbi.nlm.nih.gov/112774/ 没法访问]，让deekseek读的。求大佬&lt;br /&gt;
&lt;br /&gt;
==== 人卫的生理学第十版提到胶质细胞参与GABA在神经系统中的代谢是通过GABA脱羧酶催化生成琥珀酸半醛（P285），但是根据反应的产物和底物来看，这更应该是脱氨，而非脱羧？ ====&lt;br /&gt;
写错了，实际上是动用了转氨酶。建议移到[[教材错误与矛盾]]&lt;br /&gt;
&lt;br /&gt;
=== 植物生理学 ===&lt;br /&gt;
&lt;br /&gt;
==== 为什么植物细胞将质子泵出去，再让钾离子进来这一过程对细胞水势下降有贡献？理论上来说不是相同数量的钾离子进来后就进不来了吗？ ====&lt;br /&gt;
追问《植物生理学》水势：我的意思是，假如泵出去10个质子，不是只会进来10个钾离子就结束了吗？和氯离子没有关系吧？&lt;br /&gt;
&lt;br /&gt;
解答：在气孔打开时，H+-atp酶会将质子泵出去，氯离子会伴随着钾离子的大量吸收而吸收，于是会导致细胞水势下降。（可见王小菁第八版P25）&lt;br /&gt;
&lt;br /&gt;
↑补充答主回答：质子对水势贡献不大，更多的是通过电荷把钾离子带进来。钾离子和蔗糖是对细胞水势有更大贡献的（见Taiz 5th）。因此相同电荷的质子出去，电荷的钾离子进来，电荷守恒的同时降低了细胞内的水势。答主所说的氯离子我暂时没有找到出处，暂留异议。&lt;br /&gt;
&lt;br /&gt;
另：据苗健老师：玉米黄素并不是介导气孔开放的蓝光受体，应该是向光素介导的磷酸化途径。Taiz 7th已经删除了关于玉米黄素对气孔影响的文字，改成了向光素。但是因为国内教材都是抄的5th与6th所以都写的有玉米黄素。算是对水势的一个补充吧。这里有Taiz 7th的电子书（英文原版，&#039;&#039;&#039;856MB&#039;&#039;&#039;较大，建议开启浏览器自带多线程下载（不会自行百度）或使用IDM进行下载）：[https://cpucd.cpuikuns.top/s/GOia 分享-Plants Physi...]&lt;br /&gt;
&lt;br /&gt;
追问植物生理学那个问题：“在标准压力下，溶液的渗透势等于溶液的水势，因为溶液的压力势为0MPa。溶液的的渗透势决定于溶液中溶质颗粒（分子或离子）总数。”&lt;br /&gt;
钾离子贡献更大，是因为质子可能与有机酸等结合，相对来说颗粒总数更少吗？&lt;br /&gt;
&lt;br /&gt;
↑（个人见解，如有错误请佬指出）质子在此处的作用可以分为两部分：1）通过膜内外电位的改变使得钾离子通道开放，钾离子内流；2）质子-氯离子同向转运（见Taiz 5th，顺便解决了上一个补充回答的异议）。若是单纯质子的产生而不泵出显然无法做到这两点。所以，钾离子、质子、氯离子三者便均参与了水势的降低。另外，根据戈德曼方程可知虽然钾离子的浓度是胞内大于胞外，但电势是胞外大于胞内的。&lt;br /&gt;
&lt;br /&gt;
==== 请问有没有关于植物激素互作（比如乙烯调控IAA和JA及其下游基因）的总结，谢谢 ====&lt;br /&gt;
比较简要的总结，内容大部分来自王小菁《植物生理学（第8版）》，小部分来自网络等：&lt;br /&gt;
&lt;br /&gt;
===== 协同作用： =====&lt;br /&gt;
生长素&amp;amp;赤霉素-促进果实生长&lt;br /&gt;
&lt;br /&gt;
细胞分裂素&amp;amp;多胺-形成层分化&lt;br /&gt;
&lt;br /&gt;
独角金内酯&amp;amp;细胞分裂素-侧根生长&lt;br /&gt;
&lt;br /&gt;
独角金内酯&amp;amp;油菜素甾醇-侧根生长&lt;br /&gt;
&lt;br /&gt;
系统素（多肽激素）&amp;amp;茉莉素-抑制蛋白酶（在植物受病虫害时抑制植物蛋白的降解，保护尚未受伤的组织）&lt;br /&gt;
&lt;br /&gt;
乙烯&amp;amp;茉莉素-诱导抗病基因表达&lt;br /&gt;
&lt;br /&gt;
===== 促进作用： =====&lt;br /&gt;
生长素→乙烯产生&lt;br /&gt;
&lt;br /&gt;
脱落酸→果实产生乙烯&lt;br /&gt;
&lt;br /&gt;
茉莉素→乙烯合成&lt;br /&gt;
&lt;br /&gt;
===== 拮抗作用： =====&lt;br /&gt;
赤霉素&amp;amp;脱落酸-平衡种子发芽&lt;br /&gt;
&lt;br /&gt;
独角金内酯&amp;amp;脱落酸-侧芽生长&lt;br /&gt;
&lt;br /&gt;
多胺&amp;amp;乙烯-竞争前体（SAM）&lt;br /&gt;
&lt;br /&gt;
植物生长促进剂（生长素、赤霉素、细胞分裂素、乙烯）&amp;amp;植物生长抑制剂（脱落酸、水杨酸、茉莉素）-逆转促进/抑制作用&lt;br /&gt;
&lt;br /&gt;
===== 抑制作用： =====&lt;br /&gt;
细胞分裂素→生长素-抑制顶端优势&lt;br /&gt;
&lt;br /&gt;
乙烯→生长素-抑制转运&lt;br /&gt;
&lt;br /&gt;
脱落酸→生长素-抑制运输&lt;br /&gt;
&lt;br /&gt;
水杨酸→乙烯-抑制ACC转变为乙烯&lt;br /&gt;
&lt;br /&gt;
茉莉酸→乙烯对黄化苗顶端弯勾形成的促进作用&amp;lt;small&amp;gt;&#039;&#039;&#039;&amp;lt;u&amp;gt;（追问：可以问一下此条来源吗？答：&amp;lt;/u&amp;gt;&#039;&#039;&#039;&amp;lt;/small&amp;gt;https://doi.org/10.1105/tpc.113.122002&amp;lt;small&amp;gt;&#039;&#039;&#039;&amp;lt;u&amp;gt;）&amp;lt;/u&amp;gt;&#039;&#039;&#039;&amp;lt;/small&amp;gt;&lt;br /&gt;
&lt;br /&gt;
乙烯→茉莉酸介导的植物伤害防御反应（通过加强茉莉酸代谢）&lt;br /&gt;
====想问一下有没有关于光合电子传递链抑制剂及其作用部位的整理，谢谢！====&lt;br /&gt;
这些在书上都有，王小菁《植物生理学》第八版第84页、武维华《植物生理学》第三版第131页，这些应该够用了，没见过考别的抑制剂的&lt;br /&gt;
&lt;br /&gt;
好的我被打脸了，补充一个：羟胺，作用于OEC，抑制水的裂解&lt;br /&gt;
&lt;br /&gt;
==== 根据水势的定义，水的移动方向应当是从水势高处流向水势低处，但是为什么《植物生理学》第八版（王小菁）第151页上的图里写的是水从水势-1.1兆帕流向水势-0.4兆帕？以及这张图应当是从Taiz的书上来的，按说是不会有问题的，但是不是很理解 ====&lt;br /&gt;
这是因为在筛管中，液体是直接流动的，而非渗透作用。&lt;br /&gt;
&lt;br /&gt;
如果液体是以渗透作用流动（即，需要以水分子的形式穿过一层膜），那么水就不可能逆水势流动。但现在，在筛管的两端之间没有任何阻拦，水以水流而非单个水分子的形式流动，就只考虑压力而不考虑水势了。&lt;br /&gt;
&lt;br /&gt;
如果不好理解，可以这样想：有两个杯子，一个高，一个低。高的水杯重力势高，但溶解了许多盐使水势低于低的杯子中的水。现在用管子把两个杯子连接，水自然会从高处的杯子流入低处的杯子，不会管你的水势到底谁高谁低。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;抗坏血酸氧化的磷氧比为什么是1呢？&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
抗坏血酸底物可以直接通过Cyt c 传递电子进行氧化，其 P/O比值接近&#039;&#039;&#039;1。（自wiki）&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
=== 进化生物学 ===&lt;br /&gt;
&lt;br /&gt;
==== fay and wu 的H 较tajima的d的优点？ ====&lt;br /&gt;
鉴于这两个我一个都不会算，于是去查维基百科，得到的结果如下：&lt;br /&gt;
&lt;br /&gt;
①两者都是借由计算差异位点（分离位点S）数目和采样对之间核苷酸差异的数量（这些称为成对差异）这些数据计算群体遗传参数θ后统计得出的统计量，前面的计算过程基本一致，只是最后的统计量采用了不同表示方法；&lt;br /&gt;
&lt;br /&gt;
②相较于D，H的优点在于，当群体内含有过多罕见多态性时，H能够在D的基础上给出在此情况下进化的方式（例如选择性清除等等），而不是仅仅给出非随机进化的结论，这个优势是基于H参考了外群数据，因此纳入了祖先性状，若与祖先性状一致则该位点可能是经历了负选择等等&lt;br /&gt;
&lt;br /&gt;
（当然这都是维基百科说的，[[:文件:Genetics1405.pdf|原文]]里面没看懂哪有外群，不过确实是区别了选择性清除和其他因素，至于计算这块儿我就爱莫能助了）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;人类进化分析为何不用x或常染色体？&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
一般只用mt或y，好像是因为不会重组&lt;br /&gt;
&lt;br /&gt;
=== 遗传学 ===&lt;br /&gt;
&#039;&#039;&#039;累加作用，积加作用，叠加作用在遗传比例方面的区别是什么呢？&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
累加作用：1:4：6:4：1&lt;br /&gt;
&lt;br /&gt;
积加：9:6：1&lt;br /&gt;
&lt;br /&gt;
叠加：15:1[[文件:半不育.png|缩略图]]&lt;br /&gt;
&lt;br /&gt;
==== 有关平衡易位杂合体“半不育”的疑问：理论上来说平衡易位杂合体可产生六种配子，其中仅两种是相间分离产生，即1/3配子可育而2/3配子不育。书上的叙述是利用50%配子不育的现象提出了易位，说明半不育是实验观察到的结果，是否有合理的解释为何1/3的可育配子在实际情况下变为50%可育？(来自重庆某高一生竞生） ====&lt;br /&gt;
如右图所示，平衡易位杂合体确实存在3种分离方式，但其发生概率并不相同；对于导致可育配子的相间分离和导致不育配子的相邻分离-1而言，其同源着丝粒相互分开，慨率较大且相等；对于导致不育的相邻分离-2而言，其同源着丝粒之间不分开，比较罕见。&lt;br /&gt;
&lt;br /&gt;
因此大体上看，主要会注意到相间分离和相邻分离-1，看起来确实接近一半的配子不育。&lt;br /&gt;
&lt;br /&gt;
==== 单倍体和一倍体明显的差异是什么呢？ ====&lt;br /&gt;
一倍和单倍这两个术语之间的区别微妙： 一倍染色体组是在多倍体系列的物种(如菊属)中成倍增加的基本染色体组。 单倍染色体组是存在于配子中的染色体集合，不管该物种的染色体数目是多少。 因为在二倍体生物中，一倍染色体组和单倍染色体组是一样的，所以可能出现混淆。想一 想四倍体，有助于弄清这一区别：四倍体含四个一倍染色体组，因而单倍体配子是二倍体。&lt;br /&gt;
&lt;br /&gt;
==== 人类染色体三体中，除了13、18、21、X、Y之外，还有哪些三体类型是可存活的？ ====&lt;br /&gt;
较少见的 8 号染色体三体、9 号染色体三体、22 号染色体三体亦可存活但表现异常；其余常染色体三体通常导致夭折。&lt;br /&gt;
&lt;br /&gt;
=== 生物技术 ===&lt;br /&gt;
&lt;br /&gt;
==== 如何制备emsa所用核酸探针？ ====&lt;br /&gt;
解答：要做EMSA首先要有参考基因组，然后化学合成/不对称PCR即可？&lt;br /&gt;
&lt;br /&gt;
=== 生态学 ===&lt;br /&gt;
&lt;br /&gt;
==== 为什么标志重捕法属于绝对密度测定，而捕捉属于相对密度测定；换言之，绝对密度测定与相对密度测定的区别到底是什么？ ====&lt;br /&gt;
绝对密度测定就是得出数据以后，所得数据指的是这个环境中物种密度的真实数据；相对测定就是说所得数据不是种群密度本身，而是一个可以反映种群密度的一个数据。&lt;br /&gt;
&lt;br /&gt;
举例，通过标志重捕法得出的数据是“432只/平方公里”这样的，是密度本身；但捕捉得出的数据只能是“一网能捞到三条鱼”，然后通过“一网三条鱼”来反映真实的密度（比如在15条鱼/平方米的情况下，一网恰好能捞到三条鱼）。&lt;br /&gt;
&lt;br /&gt;
类似的，“一小时能听到20次鸟叫”“一平方公里可以找到五十个粪堆”，都是不能直接得出种群密度，只能间接反映的，因此是相对密度测定。&lt;br /&gt;
&lt;br /&gt;
==== 生态学中用相邻个体最小距离检验分布型时，D=1/ (2N^{1/2})公式的推导过程？ ====&lt;br /&gt;
[[文件:屏幕截图 2024-11-14 190159.png|缩略图]]&lt;br /&gt;
（或许公式可以重新改一下下？有点不太明白）&lt;br /&gt;
&lt;br /&gt;
解答：&lt;br /&gt;
&lt;br /&gt;
在泊松分布中，有零个个体分布在指定的半径为r的区域内的概率P(零)=exp{-λπr²}&lt;br /&gt;
&lt;br /&gt;
因此，P(R≤r)=1-exp{-λπr²}&lt;br /&gt;
&lt;br /&gt;
其概率密度函数f(r)=2λπrexp{-λπr²} （根据P(x＜a)=∫(0→a)(f(x)) dx）&lt;br /&gt;
&lt;br /&gt;
所以距离的期望E(r)=∫(0→∞)r×f(r) dr=∫(0→∞)2λπr²exp{-λπr²} dr=1/(2λ^{1/2}).&lt;br /&gt;
&lt;br /&gt;
(该积分换元后使用Γ函数计算)（λ在这里表示分布密度，即图中的N）&lt;br /&gt;
&lt;br /&gt;
==== 什么是局域资源增强？ ====&lt;br /&gt;
当亲属互相帮助而不是相互竞争时，就会发生局部资源增强 (&#039;&#039;&#039;Local resource enhancement&#039;&#039;&#039; LRE)。在合作饲养者中，母亲会在先前的后代的帮助下抚养新的后代。在具有这些系统的动物中，如果帮手不足，预计雌性会优先生育帮助性别的后代。母亲调整后代性别比例的选择强度取决于它们从帮手那里获得的利益大小。&lt;br /&gt;
这些预测在非洲野狗身上得到了证实，雄性对它们的母亲更有帮助，因为它们与母亲留在同一个群体中，并帮助为母亲和她的新生后代提供食物.LRE 预计会导致性别比偏向雄性，这也是自然界中观察到的模式。&amp;lt;ref name=&amp;quot;:1&amp;quot;&amp;gt;[[wikipedia:Sex_allocation|Sex allocation - Wikipedia]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== 行为学 ===&lt;br /&gt;
&lt;br /&gt;
==== 空间出局雌性效应是什么？ ====&lt;br /&gt;
♀占有、积极保卫大领域，♂不能成功保卫足够领地支持多配制，致使婚配制度为单配制的现象。&lt;br /&gt;
&lt;br /&gt;
===生物信息===&lt;br /&gt;
&lt;br /&gt;
====求助！基于字符（或说基于性状/基于序列）的建树与基于距离的建树，其本质区别是什么？字符/性状/序列/距离是指什么？====&lt;br /&gt;
可以这样粗略的理解：&lt;br /&gt;
*基于字符，就是要具体分析序列中的基本单位是如何变化的，要具体到从某个残基变到了某个残基。&lt;br /&gt;
*基于距离，则不用这么具体，只需要知道不同的序列之间有多少不同即可。&lt;br /&gt;
*举个例子：最大似然法（ML）是基于字符的建树方式。那么在使用ML建树时，我们要具体分析从某个碱基变化到另外一个碱基的概率是多少。比方说从A-&amp;gt;T，在具体计算的时候要考虑这样变化的概率是多少？A-&amp;gt;G呢？通过这种方式，得出最可能的情况。当然实际计算要复杂的多。&lt;br /&gt;
*再举个例子：UPGMA法是基于距离的建树方式。在使用UPGMA法建树时，我们首先要列出不同序列之间距离的矩阵，然后根据距离从小到大聚类。在这种情况下，我们并不需要知道碱基具体是如何变化的。同样的，这只是基于距离建树防范中最简单的一种，实际情况肯定会更加复杂。&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E6%8F%90%E5%87%BA%E4%BD%A0%E7%9A%84%E9%97%AE%E9%A2%98&amp;diff=5895</id>
		<title>提出你的问题</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E6%8F%90%E5%87%BA%E4%BD%A0%E7%9A%84%E9%97%AE%E9%A2%98&amp;diff=5895"/>
		<updated>2025-04-27T03:32:38Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;br /&gt;
应该有不少生物竞赛的学生在访问这个网站。为此创建这样一个页面。&lt;br /&gt;
&lt;br /&gt;
提问者：注册一个账号即可编辑，请在“未解答”栏目写下你学竞赛的问题，&#039;&#039;&#039;请注明身份。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
回答者：大佬们可以访问这个页面来查看有没有新的问题。如果您可以解答，请在问题下方编辑（没有编辑按钮就去登录）好回答，并将该词条转移到“已解答”栏目。&lt;br /&gt;
&lt;br /&gt;
或者也可以在这里提出您需要的整理。&lt;br /&gt;
&lt;br /&gt;
建议大家回答问题的时候标注一下知识来源&lt;br /&gt;
&lt;br /&gt;
== 未解答 ==&lt;br /&gt;
&lt;br /&gt;
=== 遗传学 ===&lt;br /&gt;
如果一对等位基因之中一个缺失了，让此二倍体生物不断自交，可否因为缺失同源区段无法交换发生假连锁。&lt;br /&gt;
&lt;br /&gt;
XXY的果蝇如果Sxl的PE启动子突变了，可以发育成有育性的雄果蝇吗？&lt;br /&gt;
&lt;br /&gt;
=== 生物化学 ===&lt;br /&gt;
&lt;br /&gt;
甲酰CoA在人体中是怎么代谢的？&lt;br /&gt;
&lt;br /&gt;
二羟丙酮的还原性源自哪里？&lt;br /&gt;
&lt;br /&gt;
肝中醛缩酶B机理是同A（共价席夫碱）还是同真菌细菌中Zn2+金属催化？（我猜测是同A，可能是基因*2的产物）&lt;br /&gt;
&lt;br /&gt;
=== 生物技术 ===&lt;br /&gt;
基因工程载体的转化，只能特指对原核细胞的操作吗？(同：转染也特指对真核细胞？)除此之外，转化与转染还有没有其他的本质差异？&lt;br /&gt;
&lt;br /&gt;
=== 生态学 ===&lt;br /&gt;
求英美学派，法瑞学派，前苏联学派和北欧学派的区别qwq&lt;br /&gt;
&lt;br /&gt;
求问一些计算频度或基盖度时取样地的规模或高度的整理&lt;br /&gt;
=== 生物信息 ===&lt;br /&gt;
如何在uniprot中查询蛋白复合体的结构？如果不能，有什么组装蛋白复合体的软件？&lt;br /&gt;
&lt;br /&gt;
=== 分子生物学 ===&lt;br /&gt;
链霉溶菌素和利链霉素是一个东西吗？（根据找到的资料，它们都作用于RNA聚合酶的核心酶β亚基，抑制转录延伸）&lt;br /&gt;
&lt;br /&gt;
关于杨Sir新版生化中的一个矛盾点(个人认为可能是杨Sir写错了，麻烦各位佬看看)：第四版P660中关于加尾反应的CTD磷酸化信号的叙述中，杨Sir明确表明Ser2的磷酸化是由TFIIH介导的，但与前述转录进入延伸后THIIH留在起始处似乎矛盾，本人翻看了Weaver和杨Sir的分子，其中Weaver并未提及相关内容，而杨Sir的分子第二版中只在BOX8-1中含糊其辞的提到“可由不同的蛋白激酶催化”，上网搜索找到一篇文章(CDK13 cooperates with CDK12 to control global RNApolymerase II processivity)，发现CDK12/13磷酸化了CTD中的Ser2，双敲除突变体会导致加尾异常，故认为应该是杨Sir写错了（顺便问一句这个可以去哪里给杨Sir反馈一下吗？）&lt;br /&gt;
&lt;br /&gt;
有佬能简单对比一下相向复制（朱玉贤P44）与单向，双向复制的区别吗？&lt;br /&gt;
&lt;br /&gt;
=== 植物及生理学 ===&lt;br /&gt;
&lt;br /&gt;
关于蕨类的幼叶拳卷现象，是大多数蕨类都有？还是只有真蕨亚门有呢？有哪些蕨类没有？&lt;br /&gt;
&lt;br /&gt;
乙醇酸氧化酶和黄素氧化剂酶的区别？详细些的求求了（末端氧化酶）&lt;br /&gt;
&lt;br /&gt;
看图要怎么区分假年轮和年轮？&lt;br /&gt;
&lt;br /&gt;
有关光合作用电子传递中的原初电子受体、原初电子供体以及D、P、A的定义好像很混乱，在王小菁第八版、潘瑞炽第七版和武维华第三版上面的说法都不一样，那么那本书是正确的呢？还是说就是有争议的？（我没有外文教材，所以不知道国外怎么写的）&lt;br /&gt;
&lt;br /&gt;
武维华书中关于钴元素，表述为豆科植物Co含量高而禾本科含量少；wikipedia中指出Co促进豆科植物共生根瘤菌的固氮作用。请问其机理是什么？&lt;br /&gt;
&lt;br /&gt;
十字花科、石竹科、禾本科都有干柱头，同时它们都是三细胞型花粉粒，请问其中有何联系？&lt;br /&gt;
&lt;br /&gt;
花药壁纤维层的细胞径向壁到底有没有加厚？陆和马的图上画的好像有，但是文字描述没说有还是没有；傅承新上说有。&lt;br /&gt;
&lt;br /&gt;
=== 动物及生理学 ===&lt;br /&gt;
能不能整理一下生理学毒素和特异性阻断剂&lt;br /&gt;
&lt;br /&gt;
能认真说说关于多孔动物门的胚胎逆转现象吗&lt;br /&gt;
&lt;br /&gt;
关于应激反应和应急反应，参加反应的激素有哪些区别呢？&lt;br /&gt;
&lt;br /&gt;
腹毛动物是假体腔动物还是无体腔动物？其有没有假体腔？&lt;br /&gt;
&lt;br /&gt;
关于乌贼的石灰质内壳，应该是来源于外套膜的分泌，同时体内出现了中胚层形成的软骨，为什么说石灰质内壳是外、中胚层来源的呢？&lt;br /&gt;
&lt;br /&gt;
肋骨三问：&lt;br /&gt;
&lt;br /&gt;
# 原始两栖类和爬行类它们全身具肋骨，同时还具有不同形态，不同发达程度的双锥体，它们的椎弓位置也在变化，那么它们的肋骨是如何与脊椎相连的？希望有个总结。&lt;br /&gt;
# 肉鳍鱼亚纲基部类群皆无椎体结构，那么他们是否有肋骨？如果有他们是和鲟鱼一样与基腹弓片形成关节还是另有可能？&lt;br /&gt;
# 鸟类椎肋和胸肋之间的关节是否是用于呼吸，因为它椎肋被椎状突固定而胸肋又被龙骨突固定死，需要有活动胸廓的位置？&lt;br /&gt;
&lt;br /&gt;
任淑仙《无脊椎动物学（第二版）》P248讲节肢动物的复眼小眼时，在重叠像一段提到了“屏幕效应”，本人搜索无果，望众贤解答（虽然是小细节）&lt;br /&gt;
&lt;br /&gt;
求孢子纲系统发生上重要事件&lt;br /&gt;
&lt;br /&gt;
求一个各种动物的血小板或血栓细胞等的总结&lt;br /&gt;
&lt;br /&gt;
胆碱能性荨麻疹发病机制&lt;br /&gt;
&lt;br /&gt;
能不能整理一下解剖各种模式动物的方法步骤和注意事项&lt;br /&gt;
&lt;br /&gt;
哪些神经递质或激素对应的受体通过G蛋白βγ亚基进行信号转导（细胞书、生理书还有机构讲的都不完全一致）？&lt;br /&gt;
&lt;br /&gt;
关于园田螺的血色蛋白：&lt;br /&gt;
&lt;br /&gt;
猿辅导某套综合卷解析视频中给的总结是：园田螺无血色蛋白，依赖血清蛋白运输氧气&lt;br /&gt;
&lt;br /&gt;
而《普动》上写的是具有血蓝蛋白(P202)，上网搜查两种说法都能找到，所以实际上是什么呢？&lt;br /&gt;
&lt;br /&gt;
视杆细胞持续的阳离子内流到底是钠离子通道介导还是非选择性阳离子通道介导？胞生上说是非选择性阳离子通道，但是生理学原理和动物生理学上说的是钠离子通道&lt;br /&gt;
&lt;br /&gt;
请问蚯蚓 有无蚯蚓血红蛋白？好像认为蚯蚓血红蛋白是沙蚕里的。&lt;br /&gt;
&lt;br /&gt;
多孔动物的胚胎逆转到底指的是植物极大细胞开孔到形成两囊幼虫的过程，还是两囊幼虫小细胞内陷的过程？&lt;br /&gt;
&lt;br /&gt;
能否整理一下昆虫的激素分泌以及作用？&lt;br /&gt;
&lt;br /&gt;
楯鳃和羽状鳃有什么区别？我看它们的描述都是鳃轴两侧均有鳃丝，先端游离呈羽状&lt;br /&gt;
&lt;br /&gt;
犀鸟什么趾型，鸟类学只是说不是对趾&lt;br /&gt;
&lt;br /&gt;
薮枝螅水螅体的触手是实心还是空心的？（普动和无脊椎中的描述貌似矛盾了）&lt;br /&gt;
&lt;br /&gt;
=== 动物行为学 ===&lt;br /&gt;
负竞争和反竞争是什么概念，有什么例子吗&lt;br /&gt;
&lt;br /&gt;
固定行为型的强度速度怎样被刺激强度影响，有什么例子吗&lt;br /&gt;
&lt;br /&gt;
=== 细胞生物学 ===&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
== 已解答 ==&lt;br /&gt;
&lt;br /&gt;
=== 植物学 ===&lt;br /&gt;
&lt;br /&gt;
==== 弹丝与假弹丝分别是几倍体： ====&lt;br /&gt;
除了吴国芳，马炜梁两本书上含混不清的阐述，我所见到全部其他资料都表示：弹丝，假弹丝都是二倍体。区别在于：弹丝是单细胞的，有螺纹的加厚，而假弹丝是多细胞连成的，无螺纹加厚。&lt;br /&gt;
&lt;br /&gt;
弹丝是小孢子母细胞不经过减数分裂形成，为2n；假弹丝是造孢细胞的子细胞连续有丝分裂形成(含2-4个细胞)，为2n&lt;br /&gt;
&lt;br /&gt;
注:如果你和我一样用的&#039;&#039;&#039;喵&#039;&#039;&#039;的古早网课的话，不必在意其中弹丝是n的奇妙言论&lt;br /&gt;
&lt;br /&gt;
==== 水韭的形成层： ====&lt;br /&gt;
这是一个至今仍有争议的问题。一般认为水韭有形成层，但只向内形成次生木质部，向外形成皮层而非韧皮部。[https://doi.org/10.1086/329874 参考文献]&lt;br /&gt;
&lt;br /&gt;
——答主的参考文献写的是&amp;quot;The cambium does not form phloem&amp;quot;？应该是形成层只形成次生木质部而不产生次生韧皮部才对啊？&lt;br /&gt;
&lt;br /&gt;
==== 2024年联赛有关禾本科颖片、稃片的一题有何问题 ====&lt;br /&gt;
根据马炜梁，四个选项都是苞片（见三版P382与P257）。按最新的分子证据，内稃外稃都是花被同源，因此怎么也犯不着选ABC。评议稿答案给ABC可能是因为很多机构是这么讲的。&lt;br /&gt;
&lt;br /&gt;
——根据陆时万，答案是ABC。还有一两本教材，也跟随了陆时万的说法。本以为这个题在通行的教材上有争议所以答案可能是遵循了最新的研究，没想到是最古早的陆时万的说法。我只能说出题人学的二五八万的还想考察别人。&lt;br /&gt;
&lt;br /&gt;
——黎维平在论文《关于禾本科的一些误解——植物学教材质疑(八)》中详细整理描述了学界关于这一问题的几种观点：[https://lib.cqvip.com/Qikan/Article/Detail?id=7107555585&amp;amp;from=Qikan_Search_Index]&lt;br /&gt;
&lt;br /&gt;
# &amp;lt;s&amp;gt;外稃-特化的苞片，内稃-两片近轴端合生的小苞片，浆片-变态的花被片&amp;lt;/s&amp;gt;&lt;br /&gt;
# 外稃-苞片，内稃-两枚合生的外轮花被片，浆片-变态的花瓣（内轮花被片）&lt;br /&gt;
# 【有分子证据】外稃、内稃-外轮花被&lt;br /&gt;
# &amp;lt;s&amp;gt;外稃、内稃-苞片&amp;lt;/s&amp;gt;&lt;br /&gt;
&lt;br /&gt;
* 颖片被广泛认为是苞片与总苞片，同时有分子证据支持/反对颖片与外稃同源&lt;br /&gt;
&lt;br /&gt;
* 最后总结：浆片是内轮花被片（这是学界共识），内稃是外轮花被（得到分子、发育证据支持），颖片与叶同源应该没有异议，但是外稃的来源仍然存在争议。&lt;br /&gt;
&lt;br /&gt;
==== APG 分类系统较传统分类系统增加了哪些科级新类别？ ====&lt;br /&gt;
首先纠正一点，APG系统里面没有科的概念，都是单系群。叫科只是大家习惯这么说了而已。具体的改动比较明显的马炜梁已经讲过了。例如被压榨的百合科，移到石蒜科的葱属，原玄参科现在泡桐科的泡桐，新加的车前科；还有很多被并入或拆分的科，例如原忍冬科的荚蒾属接骨木属被并入五福花科，椴树科、梧桐科、木棉科的植物并入锦葵科，毛茛科的芍药升为芍药科。还有很多的细节，题主可以买一本浙大傅承新植物学第二版看看。改动特别明显且是必背科的有玄参科、百合科、锦葵科、天门冬科、忍冬科、五味子科。&lt;br /&gt;
&lt;br /&gt;
==== 石竹目胎座的演化关系？ ====&lt;br /&gt;
中轴胎座(石竹科麦瓶草属：中轴胎座，但子房室间隔在上部已消失，形成不完全的3室)→特立中央胎座(石竹科的大多数，子房室间隔消失)→基底胎座，胚珠减少→最终阶段：藜科(基底胎座，1胚珠，胞果)&lt;br /&gt;
&lt;br /&gt;
==== 菊科假舌状花是否可以结实？网上显示假舌状花属于雌花或中性花，理论上可以结实？若可以结实，请问哪些常见菊科植物的假舌状花属于雌花呢？谢谢！(类别：植物学) － 来自重庆某新高一生竞生 ====&lt;br /&gt;
雌性的可以，中性的不能。菊花就是边缘假舌状花和管状花都结实。见陆时万植物学修订版下册P315菊属第三行“雌性，假舌状，两者均结实”。再比如向日葵边缘的花就是中性的不能结实，没见过吃的瓜子有从边缘花摘的&lt;br /&gt;
&lt;br /&gt;
==== 关于地钱假根：马炜梁老师书P172图8-4a中将地钱配子体下表皮的多细胞结构称为鳞片，而浙大傅承新老师书P85图4-52中将其称为多细胞鳞片状假根，网上搜索结果显示该结构具有吸收功能，所以何者说法更准确？ ====&lt;br /&gt;
A1:个人觉得要真是考试用的话建议按马炜梁记，吸收功能的话马炜梁那本书应该也承认了有这个功能，傅承新的那本书做出这个结论也应该是基于功能的，不过也不排除有分子学证据支持两者同源的，只是目前我查到的非中文资料里没有几个特别强调“鳞片”和“假根”两个词的，倒是&amp;quot;rhizoids&amp;quot;（“根状体”）一词用的较多。&lt;br /&gt;
&lt;br /&gt;
A2:有一个首都师范大学做苔藓的博士说，多细胞的是鳞片，单细胞的是假根，陆时万的植物学认为两者都有吸收功能（很有限）&lt;br /&gt;
====苏铁叶算羽状复叶还是羽状深裂====&lt;br /&gt;
据多识植物百科，应为羽状深裂&lt;br /&gt;
&lt;br /&gt;
==== 植物孤雌生殖产生几倍体 ====&lt;br /&gt;
这个东西就涉及到一个争议性比较大（主要是主流教材写的都有些问题）的内容--无融合生殖。不过一般来说参考胡适宜先生的《被子植物生殖生物学》比较多些。这个问题就依胡适宜先生的观点解释了。&lt;br /&gt;
&lt;br /&gt;
单就“孤雌生殖”这个名词而言，是被归入了单倍体无融合生殖的，也就是说，这个植株是源于未受精的减数分裂后的细胞，因此其实产生的是单倍体植株而且大多不育。再细讲一点的话这个名词只局限于由单倍体的卵细胞发育成新植株，而由反足细胞和助细胞发育的我们称为无配子生殖。&lt;br /&gt;
&lt;br /&gt;
不过鉴于胡适宜先生的这本书并不是那么新，因此现在的业界观点是否改变并不好说，但偶数年还是以她的观点为依据的。&lt;br /&gt;
&lt;br /&gt;
顺道就补充一下无融合生殖咯：[[无融合生殖]]&lt;br /&gt;
&lt;br /&gt;
====请问次生虫媒传粉是什么东西（2016年联赛的解析里提到，垂柳是次生虫媒传粉，但没找到资料）====&lt;br /&gt;
&lt;br /&gt;
解答：参见杨柳科的系统发育，杨柳科的祖征是风媒传粉，而部分柳的虫媒传粉其实是其独立进化出的衍征，与被子植物的原始（初生）虫媒不同，自然可称为次生的虫媒传粉。&lt;br /&gt;
&lt;br /&gt;
====为什么有些植物的花是闭花授粉，但授粉完成后还会开放呢？(如豌豆)====&lt;br /&gt;
&lt;br /&gt;
我结合了手头有的书本、我自己的想法以及DS的帮助，个人觉得可能有以下几点原因：&lt;br /&gt;
*&#039;&#039;&#039;基因备份机制&#039;&#039;&#039;：虽然豌豆通过闭合花蕾完成自花授粉，但开放花朵仍保留一定的异花授粉潜力。这种冗余设计在极端环境（如花粉败育）下可引入外来基因，避免种群灭绝。&lt;br /&gt;
*&#039;&#039;&#039;生态信号传递&#039;&#039;&#039;：开放花朵释放挥发性萜类物质（如β-石竹烯），吸引捕食性昆虫控制蚜虫种群；成熟豆荚借助开放花瓣的视觉信号（黄色素反射550nm波长），提示食果动物采集传播。&lt;br /&gt;
*&#039;&#039;&#039;祖先特征残留&#039;&#039;&#039;：与豌豆亲缘关系较近的物种大多是开花后依赖昆虫异花授粉，可能豌豆的自花授粉形状是独立进化出的，但仍然保留了开花的特征&lt;br /&gt;
&lt;br /&gt;
提醒：这只是个人不成熟的猜想，由于资料有限，不能保证回答的百分百正确。如果有确凿的证据或者本回答有错误，欢迎补充与指正&lt;br /&gt;
&lt;br /&gt;
后人补充：本人教练曾经指出如下猜想（来源不明）：豌豆的祖先可能是异花授粉的，这时它有鲜艳的，开放的花；而在进化中异花授粉的性状丢失，代之以闭花授粉，开放的鲜艳的花性状是保留的。换言之，授粉完成后还会开放的性状或为一种遗痕性状。&lt;br /&gt;
&lt;br /&gt;
感谢回答🙏，根据我在马《植物学》386页看到的内容：稻、小麦虽然有成套的风媒传粉机制，但是大多数却是自花授粉的，这是因为人类几千年以来的选育，以结实为保障造成的，而这种情况在虫媒传粉的植物中也能见到，如豌豆、蚕豆。它们的花结构其实是适应虫媒传粉的&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;外生菌根、内生菌根和内外生菌根到底哪个（哪些）会侵入细胞原生质体？&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
据gyf所说，&#039;&#039;&#039;均不会&#039;&#039;&#039;。内生菌根仅为穿透细胞壁，与&#039;&#039;&#039;细胞质膜内陷&#039;&#039;&#039;形成的共生界面进行物质交换，并未穿透细胞膜。（貌似与大部分观点冲突）&lt;br /&gt;
&lt;br /&gt;
=== 动物学 ===&lt;br /&gt;
&lt;br /&gt;
==== 同上书 P354讲苔藓动物胃绪(funiculus)时提到它由“间质细胞 ”形成，这与《普通动物学》等所讲（由体腔上皮形成）是否相违背？（虽然还是小细节） ====&lt;br /&gt;
首先搞清楚实质细胞和间质细胞的定义，这个组织或器官里面起功能的叫实质细胞，辅助功能的叫间质细胞，体腔上皮是一个组织，一个组织里面本来就有实质细胞和间质细胞。假定这里说的是体腔上皮细胞（实质细胞），那这俩本来不就挨在一起吗，还是一样的。看不出有什么冲突的点。&lt;br /&gt;
&lt;br /&gt;
另外形态学的观点，看着在哪就是哪，这种在一起的结构本来就说啥的都有。如果真想知道从哪里来可以自己做转录组和细胞谱系分析，虽然这也多半得到的结果是很迷惑，除了肝细胞、血细胞、生殖细胞，其它细胞的谱系都不是很清楚。&lt;br /&gt;
&lt;br /&gt;
==== 关于弓鳍鱼的鳞片：《普通动物学》“圆形硬鳞”；杨安峰《脊椎动物学》前后分别提到是圆鳞和硬鳞。应是哪个？ ====&lt;br /&gt;
（这个网站竟然SSL证书过期了，导致只能用Markdown编辑，气）题主竟然还有上古书籍杨安峰脊椎动物，正好我也有，那就回答一下吧。应该是&#039;&#039;&#039;硬鳞&#039;&#039;&#039;。首先可以去搜维基百科，因为不太会用Markdown就不放链接了，直接搜弓鳍鱼的词条即可，是硬鳞。题主所说的圆鳞估计来自于杨安峰P84吧，上面说的多鳍鱼目是圆鳞或硬鳞，但是在弓鳍鱼目明确指出了是硬鳞。普通动物学圆形硬鳞本质也是硬鳞。&lt;br /&gt;
话说什么时候这个网站才能恢复https访问，现在编辑起来好麻烦。&lt;br /&gt;
&lt;br /&gt;
==== 来自刘凌云《普通动物学》：P221上方表明十腕目左侧第5腕特化为茎化腕，而下方却说右侧。到底为哪一侧？ ====&lt;br /&gt;
任淑仙《无脊椎动物学》第二版p180:多数种类左侧（少数为右侧）第五腕，目前遇到的考试题大多表述为左侧第五腕，或许不严谨但一般也不算错&lt;br /&gt;
&lt;br /&gt;
随手补一点：&lt;br /&gt;
&lt;br /&gt;
十腕目：&lt;br /&gt;
&lt;br /&gt;
旋壳乌贼科：第五对腕均茎化&lt;br /&gt;
&lt;br /&gt;
乌贼科：左侧第五腕&lt;br /&gt;
&lt;br /&gt;
后耳乌贼科：左侧第五腕&lt;br /&gt;
&lt;br /&gt;
耳乌贼属：左侧第一腕&lt;br /&gt;
&lt;br /&gt;
僧头乌贼属：第一对腕均茎化&lt;br /&gt;
&lt;br /&gt;
微鳍乌贼科：第五对腕均茎化&lt;br /&gt;
&lt;br /&gt;
枪乌贼科：左侧第五腕茎化&lt;br /&gt;
&lt;br /&gt;
狭乌贼属：右侧第五腕茎化&lt;br /&gt;
&lt;br /&gt;
八腕目：&lt;br /&gt;
&lt;br /&gt;
十字蛸科：第一对腕均茎化&lt;br /&gt;
&lt;br /&gt;
单盘蛸科：右侧第三腕茎化&lt;br /&gt;
&lt;br /&gt;
章鱼科：右侧第三腕茎化&lt;br /&gt;
&lt;br /&gt;
船蛸科：左侧第三腕茎化&lt;br /&gt;
&lt;br /&gt;
以上只是列举几个例子，可见头足目茎化腕的情况，变化还是非常大的。不过整体而言，十腕左五八腕右三的规律是确切无疑的，普动可能是写错了。&lt;br /&gt;
&lt;br /&gt;
有些地方写第四对，是因为不把位于第四对的触腕看作腕，第五对茎化腕就成了第四对。&lt;br /&gt;
&lt;br /&gt;
以上信息来源十分古早，分类地位很可能改变，仅供娱乐，莫要上心。参考资料：张玺，齐钟彦，《贝类学纲要》，1961.&lt;br /&gt;
&lt;br /&gt;
==== 目前较为流行的动物学分类大致情况？（分蜕皮动物与冠轮动物的那一版） ====&lt;br /&gt;
[[文件:动物系统进化树.jpg|缩略图]]&lt;br /&gt;
→见右图&lt;br /&gt;
&lt;br /&gt;
（答主的图貌似有点老了，螺旋卵裂还全是未解决）&lt;br /&gt;
&lt;br /&gt;
现在螺旋卵裂分为有颚动物超门和扁虫冠轮动物两大支：&lt;br /&gt;
&lt;br /&gt;
①有颚动物超门包括颚口、微颚、轮虫、棘头四个原本在普动上写过的门（轮虫和棘头是一支，轮虫是个并系群，棘头成了轮虫下的一个目），毛颚动物目前可能要和有颚并到一支。&lt;br /&gt;
&lt;br /&gt;
②扁虫冠轮动物分出两支，一支归扁虫，一支归冠轮（像是废话），扁虫动物基部分支是中生动物（妹想到吧），之后的扁形动物和腹毛动物为姐妹群。&lt;br /&gt;
&lt;br /&gt;
③冠轮动物又进一步分为了两大支，一支是环节动物，有原本的多毛寡毛和蛭，还加上了星虫螠虫和西伯达虫，具体分的太乱，就不搞了，圆环动物门成了冠轮底下的未解决；&lt;br /&gt;
&lt;br /&gt;
④另一支分出软体动物和Kryptotrochozoa，翻译叫“氪金动物”（樂），包括触手冠动物（下分：腕足动物，含原腕足动物门和帚虫动物门；苔藓动物，含原内肛动物门及外肛动物门）和纽虫。&lt;br /&gt;
&lt;br /&gt;
——指正：Kryptotrochozoa应当翻译为“隐担轮动物”，希腊语kryptos代表隐藏的，Trochozoa代表担轮幼虫（trochophore larvae），即其幼虫是“隐藏的担轮幼虫”——发生改变但本质仍是担轮幼虫的辐轮幼虫(帚虫)、帽状幼虫(纽虫)、双壳幼虫(腕足)等等。&lt;br /&gt;
[[文件:目前基本公认的进化树.png|缩略图]]&lt;br /&gt;
（以上内容源自维基百科，其中一些分类群的定义尚有争议，但大致没错）&lt;br /&gt;
&lt;br /&gt;
==== 《无脊椎动物学》中写缠绕刺丝囊(spirocyst)仅珊瑚纲具有，但《普动》上写水螅具有卷缠刺丝囊(没写英文)，所以这两者是一个东西吗？如果不是，有什么区别？谢谢 ====&lt;br /&gt;
是一个东西，就是仅卷缠或分泌粘液，和穿刺刺丝囊区分&lt;br /&gt;
&lt;br /&gt;
==== 哪些无脊椎动物的血红（或血蓝之类）蛋白在血浆中，哪些又在血细胞中？ ====&lt;br /&gt;
非常值得总结的内容！敬请期待：[[有关呼吸色素的总结]]&lt;br /&gt;
&lt;br /&gt;
==== 青蛙如何分辨用于求偶的高频声音和用于警告的低频声音，它的听觉器官只为一个听斑，与行波理论不符？ ====&lt;br /&gt;
[[文件:Answer.png|左|缩略图|我就说翻译些外文教材有用]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
链接：[[第十七章 感觉器官]]&lt;br /&gt;
&lt;br /&gt;
==== 对报警外激素反应最强烈的工蜂年龄 ====&lt;br /&gt;
响应报警外激素的工蜂，接下来很可能在应对外敌的战斗中牺牲，所以垂垂老矣的老年工蜂会积极反应，而年少的工蜂还“大有可为”，不值得牺牲，响应就弱。&lt;br /&gt;
&lt;br /&gt;
==== 什么是初生颌关节？和初生颌有什么关联？ ====&lt;br /&gt;
初生颌关节指方骨与关节骨之间（或腭方与麦氏之间）的，上下颌之间的关节。与之相对应的是哺乳类的齿骨与鳞骨之间形成的次生颌关节。&lt;br /&gt;
&lt;br /&gt;
而初生颌是指软骨鱼和某些基部硬骨鱼那样的麦氏软骨与腭方软骨起主要功能的颌，与之相对的是上下颌功能被加入的膜原骨替代的次生颌，起功能的骨头有前颌骨、上颌骨、齿骨、隅骨。&lt;br /&gt;
&lt;br /&gt;
==== 关于鸵鸟膀胱的类型：鸵鸟的膀胱是泄殖腔膀胱还是尿囊膀胱？ ====&lt;br /&gt;
不能想当然地认为是尿囊膀胱，鸵鸟的泄殖腔分为三个部分，粪道、泄殖道和肛道，粪道连接直肠，泄殖道有输尿管和生殖管开口，肛道开口于体外，背面有腔上囊；鸵鸟的泄殖道可以储存大量尿液，起到类似其他羊膜动物的膀胱的作用，因此严格来说鸵鸟也没有膀胱，不过书上还是普遍认为鸵鸟具有膀胱，那么就按来源属于泄殖腔膀胱。 &amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt; &amp;lt;ref name=&amp;quot;:1&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==== 关于鱼类鳔体积调节与悬浮水层高度的问题：《比解》上明确写了当鱼稳定在深水层时，鳔内气体需要减少，而稳定在浅水层时需增加鳔内气体但是深水层中水压较大，压缩鱼体体积，减小浮力，鱼想要稳定在该水层中应当增加浮力才对，为何排气而非增加气体？====&lt;br /&gt;
你推理的是正确的，书上写错了。&lt;br /&gt;
&lt;br /&gt;
==== 两栖动物的肺是否能认为其具有肺泡？ ====&lt;br /&gt;
不能&lt;br /&gt;
&lt;br /&gt;
==== 北斗的题库中提到的“角手冠”是什么东西？ ====&lt;br /&gt;
疑似触手冠打错&lt;br /&gt;
&lt;br /&gt;
====为什么海鞘作为水生生物排泄物却是尿酸？====&lt;br /&gt;
&lt;br /&gt;
普动上是这么写的，但是姚yz告诉我们应该改成氨，和正常的水生生物一样。&lt;br /&gt;
&lt;br /&gt;
====蜜蜂访问豌豆花先接触那片花瓣====&lt;br /&gt;
&lt;br /&gt;
应该是先访问旗瓣。旗瓣位于最上方，是最大的一片花瓣，较为显眼，且通常具有吸引昆虫的颜色和斑纹。蜜蜂在寻找花蜜时，会首先被旗瓣吸引，落在旗瓣上。之后，蜜蜂为了获取花蜜，会继续向内深入，进而接触到翼瓣和龙骨瓣，在这个过程中完成授粉。&lt;br /&gt;
&lt;br /&gt;
====比较解剖书225页，图上好像髂动脉和股动脉画反了====&lt;br /&gt;
已经在[[教材错误与矛盾]]&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;能不能把鱼的分类整理一下&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
可在此查询，但可能要科学上网打开内部wiki链接[https://www.inaturalist.org/taxa/47178-Actinopterygii]&lt;br /&gt;
&lt;br /&gt;
等人补充一下软骨鱼分类&lt;br /&gt;
&lt;br /&gt;
=== 生物化学 ===&lt;br /&gt;
&lt;br /&gt;
==== dna与rna谁的密度大： ====&lt;br /&gt;
RNA的密度最大。&lt;br /&gt;
&lt;br /&gt;
DNA、RNA和蛋白质这三种生物大分子都具有一定的密度，其中&#039;&#039;&#039;RNA的密度最大&#039;&#039;&#039;，蛋白质的密度最低，DNA的密度介于两者之间的某一个位置。 一个特定的DNA分子的密度主要取决于它的GC含量和构象状态。 GC含量越高，密度越大。 与超螺旋结构存在的DNA密度显然要高于松弛状的DNA。 而变性的DNA密度要高于没有变性的DNA。&lt;br /&gt;
&lt;br /&gt;
附：“不同大分子的浮力密度也不同。DNA一般在1.7以上，RNA为1.6，蛋白质为1.35-1.40”此应为王镜岩第三版的错误，其第四版与比较新的教材已更正&lt;br /&gt;
&lt;br /&gt;
==== 多不饱和脂肪酸的氧化过程？ ====&lt;br /&gt;
有点意思哈~右边请！[[多不饱和脂肪酸的氧化]]&lt;br /&gt;
&lt;br /&gt;
==== 酶活力单位的定义是否有问题？ ====&lt;br /&gt;
误解主要从“所需”两字产生，删掉就好理解了。实际上就是一个速率，底物转化质量比时间m/t，只不过把这个速率用来表示酶量。比如1min这些酶（不管多少酶不管什么酶）转化了1μmol底物，那这些酶的量就是1U。相应的，如果1min这些酶转化了2μmol底物，那这些酶的量就是2U。实际上和底物相关，但是用于表示酶量。所以此“所需”非彼“所需”。在1min内转化1μmol底物需要1U酶，在1min内转化2μmol底物需要2U酶，没什么问题。至于提到的国内按什么来，国内外都是统一的，是国际酶学会订的（虽然现在酶学会更推荐用kat这个单位），做过实验动手算过就明白了。&lt;br /&gt;
&lt;br /&gt;
==== from徐长法《生物化学》下册p90，真的有无脊椎动物体内存在乙醛酸循环吗？ ====&lt;br /&gt;
解答：有。乙醛酸循环是植物和某些微生物（大肠杆菌、醋酸杆菌等）及一些无脊椎动物细胞内脂肪酸氧化分解为乙酰CoA之后，在乙醛酸循环体(glyoxysome)内生成琥珀酸、乙醛酸和苹果酸的过程。参见[https://baike.baidu.com/item/%E4%B9%99%E9%86%9B%E9%85%B8%E5%BE%AA%E7%8E%AF/619160 百度百科]（百度百科内容不一定正确，请辩证对待）&lt;br /&gt;
除了具有双功能融合 ICL-MS 基因的线虫，其他后生动物无。[https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1630690 后生动物乙醛酸循环酶的进化]&lt;br /&gt;
&lt;br /&gt;
==== 求一个关于金属酶/金属蛋白的整理。比如质膜ATP酶以Na为辅酶，精氨酸酶以Mn作为辅酶等等 ====&lt;br /&gt;
解答：先写了一点点。可以参考[https://zh.wikipedia.org/zh-hans/金属蛋白 金属蛋白]&lt;br /&gt;
&lt;br /&gt;
==== 所以反竞争性抑制剂有啥应用实例 ====&lt;br /&gt;
现实中几乎没有反竞争性抑制剂（见杨荣武生物化学原理），反竞争性抑制剂仅存在理论研究价值。&lt;br /&gt;
杨sir这里写的大概的确有问题：多见于多底物发生的生化反应中，在单一底物的酶促反应中不常见，例如L-同型精氨酸和L-苯丙氨酸等多种L-氨基酸是碱性磷酸酶的反竞争性抑制剂，它们能结合碱性磷酸酶与底物的复合物，并阻碍反应继续进行；此外，肼类化合物反竞争性抑制胃蛋白酶的活性，氰化物也是芳香硫酸酯酶的反竞争性抑制剂。&lt;br /&gt;
参考&lt;br /&gt;
SPECTOR T, HAJIAN G．Statistical methods to distinguish competitive, noncompetitive, and uncompetitive enzyme inhibitors．Analytical biochemistry，1981，115(2)：403-409．DODGSON K S, SPENCER B, WILLIAMS K．Examples of Anti-competitive Inhibition．Nature，1956，177(4505)：432-433．&lt;br /&gt;
《中国大百科全书》第三版网络版&lt;br /&gt;
&lt;br /&gt;
==== 为何盐析使用硫酸铵而非氯化钠氯化钾等？ ====&lt;br /&gt;
早期生物学家在做实验的时候发现有盐析现象，于是去找适合盐析的盐。找到最后觉得硫酸铵最好。当然不一定用硫酸铵，这个都取决于个人。毕竟盐析推荐用中性盐但是硫酸铵明显是个酸性盐但照样用。当然可以用氯化钠什么的但是效果不一定好（在家里可以把食盐撒到鸡蛋清上能看到有白色絮状沉淀）。这取决于盐的性质和待处理蛋白质的性质，有很大的多样性。&lt;br /&gt;
&lt;br /&gt;
补：今天遇到了段志贵教授，他告诉我另外一个点：硫酸铵溶解度非常大。&lt;br /&gt;
&lt;br /&gt;
话说这个问题背后的知识点还是比较复杂的。我讲两句。（咳）&lt;br /&gt;
&lt;br /&gt;
电荷密度高的离子，结合水分子的能力强，被称为“亲液的”Kosmotropic。&lt;br /&gt;
&lt;br /&gt;
电荷密度低的离子，就被称为“离液的”Chaotropic 。&lt;br /&gt;
&lt;br /&gt;
像磷酸根，硫酸根这样的多价离子，电荷多，电荷密度高，就是亲液剂；像碘离子、硫氰酸根离子，不光电荷少，分子还大，电荷密度低，就是离液剂。&lt;br /&gt;
&lt;br /&gt;
从亲液性强的排列到离液性强的离子，就成了Hofmeister序列。&lt;br /&gt;
&lt;br /&gt;
至少看起来，阳离子离液剂+阴离子亲液剂=盐析+不变性（SO&amp;lt;sub&amp;gt;4&amp;lt;/sub&amp;gt;&amp;lt;sup&amp;gt;2-&amp;lt;/sup&amp;gt;+NH&amp;lt;sub&amp;gt;4&amp;lt;/sub&amp;gt;&amp;lt;sup&amp;gt;+&amp;lt;/sup&amp;gt;），阴离子离液剂+阳离子亲液剂（SCN&amp;lt;sup&amp;gt;-&amp;lt;/sup&amp;gt;+胍）=盐溶+变性。&lt;br /&gt;
[[文件:Hofmeister serie.png|缩略图]]&lt;br /&gt;
这解释了为什么盐析用硫酸铵，而变性用异硫氰酸胍。显然这里面也有着成本、溶解性、避免形成难溶的沉淀物之类的考量。&lt;br /&gt;
&lt;br /&gt;
至于为什么，我的理解如下：蛋白质多为阴离子：&lt;br /&gt;
&lt;br /&gt;
* 如果阳离子为离液剂，此阳离子不愿结合水，反而会结合蛋白质：&lt;br /&gt;
** 蛋白质分子结合了相同的离子，相互排斥，不易沉淀，造成盐溶&lt;br /&gt;
** 结合了在蛋白质上的离子破坏了蛋白质的氢键，造成变性&lt;br /&gt;
* 如果阳离子是亲液剂，此阳离子希望结合水，便不管蛋白质：&lt;br /&gt;
** 水分子都被亲液剂结合，蛋白质缺水沉淀，造成盐析&lt;br /&gt;
** 蛋白质不会受到离子的影响，不会变性&lt;br /&gt;
* 如果阴阳离子都是亲液剂，阴阳离子互相结合而不结合水，减小总体亲液效果。&lt;br /&gt;
* 如果阴阳离子都是离液剂，阴阳离子不互相结合反而都去结合水，减小总体离液效果。&lt;br /&gt;
&lt;br /&gt;
以上是我个人的理解，不一定对，但肯定能够帮你记住这些规律😋&lt;br /&gt;
&lt;br /&gt;
==== b族维生素的组成明析 / vb8是肌醇还是腺嘌呤核苷酸  或者“生物素”（科普中国说的，笑） ====&lt;br /&gt;
[[文件:B族维生素.png|缩略图|B族维生素解析]]&lt;br /&gt;
见右侧图“B族维生素解析”&lt;br /&gt;
&lt;br /&gt;
注：此图为朱斌《生物竞赛专题精炼》P100，题主可自己看。另外这些都有争议，朱斌这里只是观点之一。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;沙林毒气的作用机理？（之前有看到说它是乙酰胆碱酯酶的自杀型抑制剂，但没有找到别的资料）&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
杨rw《生物化学原理》第三版p170  沙林即甲基氟磷酸异丙酯，是一种有机磷化物，可以共价修饰酶活性中心的丝氨酸残基的羟基使得其失活。沙林属于基团特异性抑制剂&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;Yang Sir的书上说“嘌呤环的嘧啶环和咪唑环之间有小的弯曲，故嘌呤环不完全在一个平面上”，但是根据本人浅薄的化学知识，C5和C4应当都是sp2杂化，为什么会出现弯曲呢（话说这是不是已经不是生物的范畴了）&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
环张力与键角矛盾 六元环的理想键角为120°，而五元环的理想键角约为108°。当两个环在C4和C5处稠合时，连接处的键角需要兼顾两种环的需求，导致局部键角偏离理想值（如压缩或拉伸），从而引发整体结构的扭曲。&lt;br /&gt;
共轭受限与定域化效应  尽管sp²杂化原子通常通过π共轭保持平面性，但在嘌呤中，五元环与六元环的共轭体系可能不完全连续。咪唑环的部分双键定域化（如C4-C5键的单双键特性交替），削弱了共轭的连续性，允许一定程度的弯曲。&lt;br /&gt;
孤对电子排斥与杂原子影响  嘧啶和咪唑环中的氮原子孤对电子占据不同杂化轨道（如嘧啶环的N1、N3为sp²杂化，咪唑环的N7、N9可能参与不同键合）。这些孤对电子的空间排斥可能进一步破坏平面性。&lt;br /&gt;
实验证据支持  X射线晶体学数据显示，嘌呤分子中嘧啶环与咪唑环之间存在约5°~10°的轻微弯曲（如咖啡因等衍生物），证实了结构的非完全平面性。这种弯曲在溶液中因分子振动可能更加显著。&lt;br /&gt;
&lt;br /&gt;
==== 根据周德庆《微生物学教程》，磺胺类药物抑制二氢蝶酸合成酶，但貌似一直说的是二氢叶酸合成酶，是一直说的都是错的吗？ ====&lt;br /&gt;
是的，确实是抑制二氢蝶酸合成酶。此内容也得到《微生物生物学》（霍乃蕊，余知和）的支持。&lt;br /&gt;
&lt;br /&gt;
====异亮氨酸与α螺旋的破坏关联性强不强====&lt;br /&gt;
&lt;br /&gt;
据北斗王娜所说是有的（侧链较大），但未在国内主流教材上看到该说法&lt;br /&gt;
&lt;br /&gt;
====如果说双缩脲反应的基础是两个肽键，那么假设一个氨基酸与一个酰胺氨基酸（如A-N）可以和双缩脲有颜色反应吗====&lt;br /&gt;
&lt;br /&gt;
不可以，两个氨基甲酰基不是连着的&lt;br /&gt;
&lt;br /&gt;
====卤水主要成分是氯化镁氯化钙，石膏的主要成分是硫酸钙，那为什么石膏豆腐用碱变性使蛋白质沉淀，而卤水豆腐是盐析原理呢？====&lt;br /&gt;
&lt;br /&gt;
卤水点豆腐很好解释，因为氯化镁和氯化钙的溶解度通常较高（CaCl₂溶解度为74.5g/100g水，25℃），在溶液中可以快速释放出大量二价阳离子，电荷中和效应显著，同时氯化镁是强酸弱碱盐，其溶液通常呈弱酸性（pH≈5.5-6.0），并不能完成碱变性&lt;br /&gt;
&lt;br /&gt;
而对于硫酸钙来说，其溶解度较低，CaSO₄的Ksp=4.93×10⁻⁵，在纯水中最大Ca²⁺浓度仅0.015M，无法达到盐析阈值（0.1M），因而需要碱变性处理蛋白质。但由于硫酸钙的水溶液呈中性，所以生产上要利用其他物质将溶液的pH调至碱性以使得蛋白质能够有效变性&lt;br /&gt;
&lt;br /&gt;
==== 胆固醇合成需要几个nadph？ ====&lt;br /&gt;
&#039;&#039;&#039;16个NADPH&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==== 杨Sir生化的胆固醇合成那里写到，在HMG-CoA形成之后的所有反应都在光面内质网上进行，那么为什么419又说“鲨烯合成好之后，由于不溶于水，因此需要细胞质基质中的固醇载体蛋白将其转运至内质网”？ ====&lt;br /&gt;
催化的酶在内质网膜上，活性位点在胞质面。鲨烯之后底物也跑到膜上去了。&lt;br /&gt;
&lt;br /&gt;
=== 分子生物学 ===&lt;br /&gt;
&lt;br /&gt;
==== 想求证一下，“DNA复制执照因子假说”中“执照”因子主要成分是Mcm蛋白，这是否是那种DNA解旋酶？毕竟好像在信号通路那里曾出现过一个不是后期促进复合物的APC。 ====&lt;br /&gt;
解答：单说Mcm应该是同一个家族。真核生物DNA复制所用到的Mcm2-10同时负责调控复制启动，Mcm不结合DNA也不会开始复制。关于Mcm是否是执照因子的讨论见下：&lt;br /&gt;
&lt;br /&gt;
一个异议：杨荣武《生物化学原理》3rd中，执照因子应是Cdt10和Cdc6，这两者在之后的复制过程被回收或降解。在丁明孝.等《细胞生物学》5th中，细胞周期一章的图中，有对Cdt10和Cdc6的标注，并且和杨荣武书上的过程一致，因此，如果杨荣武改题，这个知识点可能会出现极大争议。&lt;br /&gt;
&lt;br /&gt;
↑杨荣武分子生物学第二版说执照因子是Cdt1和Cdc6，至于是否包括Mcm，杨sir没有正面回答这个问题，仅说明这两种蛋白会首先结合Mcm。不过按照pre-RC的定义，应该不包括Mcm。联赛假如出了建议按杨sir来，因为他可以改题。&lt;br /&gt;
&lt;br /&gt;
==== 来自杨荣武《分子生物学》:DNAP4被用作修复，且在正常生长时被诱导合成，那么为何它“易错”？ ====&lt;br /&gt;
DNAPIV合成效率不高，本来就是修复用的。易错可以引入更多突变，提高细胞生存率，并且参与SOS途径。SOS的时候细胞都快死了，哪还会在乎这点错误。&lt;br /&gt;
&lt;br /&gt;
==== 杨sir的分生第二版P216图6-6“RecBCD酶在同源重组中的作用”中，文字是“5&#039;-外切酶”但图看起来是核酸内切酶，请问应如何理解；以及杨sir在学堂在线上讲的分生课程讲的是RecBCD先同时发挥3&#039;-外切酶与5&#039;-外切酶活性，遇到χ序列后解链酶活性被激活，但他的《分子生物学（第二版）》讲的先发挥解链酶与3&#039;-外切酶活性，遇到χ序列后再发挥“5&#039;-外切酶（？）”活性，请问应参考哪种说法？ ====&lt;br /&gt;
集训时问了杨荣武，他说按学堂在线上说的来（即“RecBCD先同时发挥3&#039;-外切酶与5&#039;-外切酶活性，遇到χ序列后解链酶活性被激活”）。&amp;lt;small&amp;gt;同时杨sir透露他的分生要开始编新版（&amp;lt;/small&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==== RecBCD是否具有5’外切酶活性，各大教材措辞不同。 ====&lt;br /&gt;
杨sir本人说有（见上一条）&lt;br /&gt;
&lt;br /&gt;
=== 细胞生物学 ===&lt;br /&gt;
&lt;br /&gt;
==== from 徐长法《生物化学》下册p153，“不同蛋白O-糖基化的起始起点并不一致，有的在内质网，有的在内质网-高尔基体中间结构，也有的在内侧高尔基体”，这句话准确吗？也就是说不是像翟中和《细胞生物学》那样只在高尔基体进行吗？ ====&lt;br /&gt;
解答：这似乎是一个&amp;quot;有争议&amp;quot;的问题。观点一：①如题，但徐长法我没有看过不做评价（我看的是杨sir和王镜岩QwQ，大佬有看过的可以验证一下）。②有[https://zhuanlan.zhihu.com/p/213786542 这篇知乎文章]描述O-linked为大多发生在内质网，黏蛋白发生在高尔基体（这篇文章给出了参考文献，可以自行验证）。观点二：①翟中和描述的是N-linked在内质网和高尔基体发生，O-linked在高尔基体发生（但是他没有给出肯定的判断）。②杨sir分子生物学第二版P393说O-linked只发生在高尔基体，一个很直接的结论。个人认为应该只在高尔基体，因为相关的糖基转移酶分布在高尔基体上。（而且杨sir能改题，直接信杨sir啊）至于其它观点不知从何而来。至少我目前做过的题都是按照高尔基体来的。&lt;br /&gt;
&lt;br /&gt;
补充一下答主的回答：其实O-linked在胞质也可进行（非典型O-linked，由N-GlcNAc连接至Ser上而成，这在丁明孝.等《细胞生物学》5th中有进行描述），而且不典型的/非翟中和的O-linked有很多形式，按糖的种类分可以包括O-GalNAc、O-GlcNAc、O-Gal、O-Man、O-Fuc、O-Glc，后三种在维基百科中提到了，而且这三种是在内质网进行的（O-Man是在内质网起始，在高尔基体完成），因此，说在内质网应该是OK的。&lt;br /&gt;
&lt;br /&gt;
另外，朱斌还在他的书里写过Tyr的“O-linked”，杨荣武也曾在讲课的时候提到蛋白聚糖的“O-linked”，总之说法很多，有很多可拓展之处。（我把维基百科扒下来了，PDF自取：[[:文件:O-linked glycosylation.pdf|O-linked glycosylation---Wikipedia]]）&lt;br /&gt;
&lt;br /&gt;
==== P62提到ABC超家族用于转运分子，而P66又说CFTR属于ABC超家族，是否矛盾？ ====&lt;br /&gt;
解答：应该是翟中和的问题，他想说的小分子是小物质的意思，不是分子的意思。离子也可以。ABC超家族是很大一类蛋白，基本上什么类型的物质都能转运。（似乎CFTR在效果上是是一个需要用ATP开启的离子通道蛋白，结构上属ATP超家族）&lt;br /&gt;
&lt;br /&gt;
追问：ATP超家族又是啥ʕ•̫͡•ʔ&lt;br /&gt;
&lt;br /&gt;
解答：就是ABC超家族，ATP binding cassette superfamily.&lt;br /&gt;
&lt;br /&gt;
==== 癌细胞体外培养是否贴壁？ ====&lt;br /&gt;
不贴壁、无接触抑制（后者为前者原因，二者同为癌细胞区别于正常细胞的现象）&lt;br /&gt;
&lt;br /&gt;
这话说的，意思是癌细胞可以被悬浮培养吗？大概不能。一般的癌细胞最开始也是贴壁长成一层，只不过长满一层后不会接触抑制，会继续长成好几层。&lt;br /&gt;
&lt;br /&gt;
==== 鞘脂的合成部位（sER or Golgi&#039;&#039;&#039;）&#039;&#039;&#039; ====&lt;br /&gt;
详见[https://www.dxy.cn/bbs/newweb/pc/post/44006920 鞘脂]&lt;br /&gt;
&lt;br /&gt;
——神经酰胺在sER上合成，再转到高尔基体上合成鞘脂。&lt;br /&gt;
&lt;br /&gt;
==== 想问一下，真核生物的核糖体还有E位点吗？ ====&lt;br /&gt;
解答：有E位点。详见视频：https://www.bilibili.com/video/BV19w4m127QK/?spm_id_from=333.337.search-card.all.click&amp;amp;vd_source=86f4f9d6f47b1620e6f209f2a952173f&lt;br /&gt;
&lt;br /&gt;
==== 来自丁明孝.等《细胞生物学》5th：为何此书上写CFTR突变体是&amp;quot;gain of function&amp;quot;? ====&lt;br /&gt;
解答:个人见解,应为编辑错误，翟好像并未严格区分逗号与分号大小问题，分号中间的逗号改为句号即可理解&lt;br /&gt;
&lt;br /&gt;
====联会复合体的装配起始在什么时候？====&lt;br /&gt;
&lt;br /&gt;
偶线期，经过粗线期，在双线期解体&lt;br /&gt;
&lt;br /&gt;
====观察样品中酶活及其分布用何种包埋？====&lt;br /&gt;
&lt;br /&gt;
答：根据王金发编写的《细胞生物学实验指南》大概是冷冻包埋，但是我手边没这本书，等等我。&lt;br /&gt;
&lt;br /&gt;
==== 间体（中膜体，拟线粒体）存在于活细胞中吗，还是只是死细胞中人为造成的结构。关于这个问题有好多说法，找不到最新的文献解释 ====&lt;br /&gt;
人为造成，但重复性良好所以被误解很多年。详情请看The Very Reproducible (But Illusory) Mesosome&lt;br /&gt;
&lt;br /&gt;
==== 求个CAR-T疗法历史的总结。 ====&lt;br /&gt;
[https://zhuanlan.zhihu.com/p/377677021 CAR-T发展历史及展望 - 知乎]&lt;br /&gt;
&lt;br /&gt;
=== 生理学 ===&lt;br /&gt;
&lt;br /&gt;
==== 关于不同离子转运蛋白耗能多少及转运离子数量的总结？ ====&lt;br /&gt;
刚刚写了一点点，还有好多好多内容需要补充→&#039;&#039;&#039;[[载体蛋白和通道蛋白]]&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==== 朱大年《生理学》第九版P295表格中提到本体感觉属于Aα型神经纤维，但是P325却提到肌梭的传入神经包括Ia和II类纤维，其中花枝末梢是II类纤维的末梢且负责本体感觉。已知II类纤维属于Aβ类纤维，前后是否矛盾？John G. Nicholls等《神经生物学》第五版也有肌梭Ia型和II型纤维分别是“动态”和“静态”的传入纤维，是否可类比“肌梭长度感觉”和“本体感觉”？那朱P295表格是否表述不妥？ ====&lt;br /&gt;
解答：ABC和 I II III IV是分别两个分类系统，其中ABC多用于传出纤维的分类，I II III IV 多用于传入纤维的分类（不绝对，多用于而已）这个地方就是Aα为支配梭外肌传出纤维、初级肌梭传入纤维（本体感觉）。题主所表述的II类纤维属于Aβ的表述是不妥的，因为根本不是一个分类系统。Aβ多为皮肤触压觉传入纤维。分类标准的话ABC主要按照传导速度，I II III IV主要按照纤维直径。关于分类[https://zhuanlan.zhihu.com/p/68321428 可见这里]，当然这些内容朱大年也写过。&lt;br /&gt;
&lt;br /&gt;
追问《生理学》关于肌梭的传入纤维：抽象的是朱大年的表格上把两种分类系统对比了一下说Aα对应Ia和Ib，Aβ对应II……&lt;br /&gt;
&lt;br /&gt;
解答：在肌紧张里面α运动神经纤维不就是Aα吗。首先注意朱大年是这么写的“I II III IV类纤维分别相当于Aα Aβ Aδ C类&#039;&#039;&#039;后根纤维&#039;&#039;&#039;，但又&#039;&#039;&#039;不完全等同&#039;&#039;&#039;”，所以先不要把两种分类混一起。Aα负责肌肉本体感觉应该是没有争议的。II类纤维朱大年只表述了“可能有关”。其实Ia类神经纤维也负责肌肉本体感觉。&lt;br /&gt;
&lt;br /&gt;
==== 哺乳动物成熟红细胞裂解后,正常小泡和外翻性小泡的形成过程 ====&lt;br /&gt;
解答：红细胞受低渗影响破裂形成血影（残留的膜骨架＋膜），膜重新闭合时可能形成正常小泡或外翻性小泡&lt;br /&gt;
&lt;br /&gt;
==== 关于血液湍流的发生以及此时的血液黏度和血流切率，个人感觉朱大年生理学P116-117上的说法有些矛盾（下列一二）====&lt;br /&gt;
# 在血液黏度低的时候容易形成湍流 &lt;br /&gt;
# 血流切率越高，层流现象越明显，即血流黏度较低；相反当血流切率较低的时候，血液黏度高&lt;br /&gt;
想问一下湍流发生的时候，血液黏度究竟是高是低？血流切率又是怎样的呢？谢谢！&lt;br /&gt;
朱大年教材中的两个表述并不矛盾，而是从不同角度描述：&lt;br /&gt;
黏度低易湍流：强调黏度对Re的直接影响（普遍规律）。&lt;br /&gt;
高切率→低黏度→层流明显：指在未达临界Re时，高切率下剪切稀化使层流更稳定；但若Re超过临界值（如高流速），仍会发展为湍流。&lt;br /&gt;
&lt;br /&gt;
==== 肾素和抗利尿激素的作用都是减少尿量，从而使循环血量增多即升高血压，但为什么抗利尿激素抑制肾素的分泌呢？ ====&lt;br /&gt;
类似负反馈，因为AngII促进ADH分泌&lt;br /&gt;
&lt;br /&gt;
==== 假设细胞内的钠离子浓度为12mM，细胞外为145mM，膜电位为-50mV，温度为37摄氏度，计算通过钠离子葡萄糖同向转运体所能达到的最大细胞内和细胞外葡萄糖浓度的比值是？A11.2 B8.69 C5940 D8690 ====&lt;br /&gt;
——和我的聚铑同学讨论了一下，他们算了很多遍都是6100多，这题的具体答案是什么？是4F吗？若果是的话再发具体解析吧--[[用户:MangoCat|MangoCat]]（[[用户讨论:MangoCat|留言]]） 2025年3月11日 (二) 19:22 (CST)&lt;br /&gt;
&lt;br /&gt;
@[[用户:MangoCat|MangoCat]]：6100多和5940差距只在四舍五入上，5940是lehninger教材上得出的答案（此题是lehninger书上的原题但原题是问答题），是在过程中就四舍五入取到ΔG11.2kj/mol了。解析mangocat来写吧。我懒。&lt;br /&gt;
&lt;br /&gt;
1.计算钠离子的电化学势能：&amp;lt;br&amp;gt;Δμ&amp;lt;sub&amp;gt;Na&amp;lt;/sub&amp;gt;=zFΔψ+RTln([Na&amp;lt;sup&amp;gt;+&amp;lt;/sup&amp;gt;]&amp;lt;sub&amp;gt;in&amp;lt;/sub&amp;gt;/[Na&amp;lt;sup&amp;gt;+&amp;lt;/sup&amp;gt;]&amp;lt;sub&amp;gt;out&amp;lt;/sub&amp;gt;)&amp;lt;br&amp;gt;带入数值:&amp;lt;br&amp;gt;z=1&amp;lt;br&amp;gt;F=96485C/mol&amp;lt;br&amp;gt;Δψ=-0.05V&amp;lt;br&amp;gt;R=8.314J/(mol·K)&amp;lt;br&amp;gt;T=310.15K&amp;lt;br&amp;gt;[Na&amp;lt;sup&amp;gt;+&amp;lt;/sup&amp;gt;]&amp;lt;sub&amp;gt;in&amp;lt;/sub&amp;gt;=12mM&amp;lt;br&amp;gt;[Na&amp;lt;sup&amp;gt;+&amp;lt;/sup&amp;gt;]&amp;lt;sub&amp;gt;out&amp;lt;/sub&amp;gt;=145mM&amp;lt;br&amp;gt;可得Δμ&amp;lt;sub&amp;gt;Na&amp;lt;/sub&amp;gt;=-11250J/mol&amp;lt;/br&amp;gt;&lt;br /&gt;
2.已知钠离子葡萄糖同向转运体以2:1的比例转运钠离子和葡萄糖。平衡时，钠离子释放的能量等于葡萄糖逆浓度梯度所需的能量：&lt;br /&gt;
&amp;lt;br&amp;gt;2Δμ&amp;lt;sub&amp;gt;Na&amp;lt;/sub&amp;gt;+Δμ&amp;lt;sub&amp;gt;Glc&amp;lt;/sub&amp;gt;=0&amp;lt;br&amp;gt;则带入计算可得:&amp;lt;br&amp;gt;Δμ&amp;lt;sub&amp;gt;Glc&amp;lt;/sub&amp;gt;=22500J/mol&amp;lt;/br&amp;gt;&lt;br /&gt;
3.又因为我们有：&lt;br /&gt;
&amp;lt;br&amp;gt;Δμ&amp;lt;sub&amp;gt;Glc&amp;lt;/sub&amp;gt;=RTln([Glc]&amp;lt;sub&amp;gt;in&amp;lt;/sub&amp;gt;/[Glc]&amp;lt;sub&amp;gt;out&amp;lt;/sub&amp;gt;)&amp;lt;br&amp;gt;所以带入数值&amp;lt;br&amp;gt;解得[Glc]&amp;lt;sub&amp;gt;in&amp;lt;/sub&amp;gt;/[Glc]&amp;lt;sub&amp;gt;out&amp;lt;/sub&amp;gt;=6156&lt;br /&gt;
&lt;br /&gt;
====关于折返激动，扑动，颤动等心律失常的介绍？====&lt;br /&gt;
折返激动是指一个激动下传后，又可沿着另一条途径回到原已兴奋的心肌所产生的异常激动。阵发性心动过速可理解为心房、房室结、房室间、心室内，由单源性折返激动回路引起有节律的快速心律失常。如心房折返速度更快打250-300次/分则为心房扑动。如折返速度更快并变得无序则为心房颤动（大于350次/分）。&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;病理生理学.2版.李桂源,吴伟康,欧阳静萍.人民卫生出版社&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;翟《细胞生物学》中提到紧密连接能形成渗透屏障，那为什么重吸收还存在细胞旁途径？&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
因为翟就在这句话下面提到了渗透屏障的相对性，举的就是肾小管的例子，一般认为这种渗漏由[https://zhuanlan.zhihu.com/p/497677014 Claudins]介导，其中Claduins2、7、10、15、16通过在紧密连接上形成空隙增加细胞旁阳离子的渗透性&lt;br /&gt;
&lt;br /&gt;
==== 人卫的生理学第十版提到胶质细胞参与GABA在神经系统中的代谢是通过GABA脱羧酶催化生成琥珀酸半醛（P285），但是根据反应的产物和底物来看，这更应该是脱氨，而非脱羧？ ====&lt;br /&gt;
写错了，实际上是动用了转氨酶。建议移到[[教材错误与矛盾]]&lt;br /&gt;
&lt;br /&gt;
=== 植物生理学 ===&lt;br /&gt;
&lt;br /&gt;
==== 为什么植物细胞将质子泵出去，再让钾离子进来这一过程对细胞水势下降有贡献？理论上来说不是相同数量的钾离子进来后就进不来了吗？ ====&lt;br /&gt;
追问《植物生理学》水势：我的意思是，假如泵出去10个质子，不是只会进来10个钾离子就结束了吗？和氯离子没有关系吧？&lt;br /&gt;
&lt;br /&gt;
解答：在气孔打开时，H+-atp酶会将质子泵出去，氯离子会伴随着钾离子的大量吸收而吸收，于是会导致细胞水势下降。（可见王小菁第八版P25）&lt;br /&gt;
&lt;br /&gt;
↑补充答主回答：质子对水势贡献不大，更多的是通过电荷把钾离子带进来。钾离子和蔗糖是对细胞水势有更大贡献的（见Taiz 5th）。因此相同电荷的质子出去，电荷的钾离子进来，电荷守恒的同时降低了细胞内的水势。答主所说的氯离子我暂时没有找到出处，暂留异议。&lt;br /&gt;
&lt;br /&gt;
另：据苗健老师：玉米黄素并不是介导气孔开放的蓝光受体，应该是向光素介导的磷酸化途径。Taiz 7th已经删除了关于玉米黄素对气孔影响的文字，改成了向光素。但是因为国内教材都是抄的5th与6th所以都写的有玉米黄素。算是对水势的一个补充吧。这里有Taiz 7th的电子书（英文原版，&#039;&#039;&#039;856MB&#039;&#039;&#039;较大，建议开启浏览器自带多线程下载（不会自行百度）或使用IDM进行下载）：[https://cpucd.cpuikuns.top/s/GOia 分享-Plants Physi...]&lt;br /&gt;
&lt;br /&gt;
追问植物生理学那个问题：“在标准压力下，溶液的渗透势等于溶液的水势，因为溶液的压力势为0MPa。溶液的的渗透势决定于溶液中溶质颗粒（分子或离子）总数。”&lt;br /&gt;
钾离子贡献更大，是因为质子可能与有机酸等结合，相对来说颗粒总数更少吗？&lt;br /&gt;
&lt;br /&gt;
↑（个人见解，如有错误请佬指出）质子在此处的作用可以分为两部分：1）通过膜内外电位的改变使得钾离子通道开放，钾离子内流；2）质子-氯离子同向转运（见Taiz 5th，顺便解决了上一个补充回答的异议）。若是单纯质子的产生而不泵出显然无法做到这两点。所以，钾离子、质子、氯离子三者便均参与了水势的降低。另外，根据戈德曼方程可知虽然钾离子的浓度是胞内大于胞外，但电势是胞外大于胞内的。&lt;br /&gt;
&lt;br /&gt;
==== 请问有没有关于植物激素互作（比如乙烯调控IAA和JA及其下游基因）的总结，谢谢 ====&lt;br /&gt;
比较简要的总结，内容大部分来自王小菁《植物生理学（第8版）》，小部分来自网络等：&lt;br /&gt;
&lt;br /&gt;
===== 协同作用： =====&lt;br /&gt;
生长素&amp;amp;赤霉素-促进果实生长&lt;br /&gt;
&lt;br /&gt;
细胞分裂素&amp;amp;多胺-形成层分化&lt;br /&gt;
&lt;br /&gt;
独角金内酯&amp;amp;细胞分裂素-侧根生长&lt;br /&gt;
&lt;br /&gt;
独角金内酯&amp;amp;油菜素甾醇-侧根生长&lt;br /&gt;
&lt;br /&gt;
系统素（多肽激素）&amp;amp;茉莉素-抑制蛋白酶（在植物受病虫害时抑制植物蛋白的降解，保护尚未受伤的组织）&lt;br /&gt;
&lt;br /&gt;
乙烯&amp;amp;茉莉素-诱导抗病基因表达&lt;br /&gt;
&lt;br /&gt;
===== 促进作用： =====&lt;br /&gt;
生长素→乙烯产生&lt;br /&gt;
&lt;br /&gt;
脱落酸→果实产生乙烯&lt;br /&gt;
&lt;br /&gt;
茉莉素→乙烯合成&lt;br /&gt;
&lt;br /&gt;
===== 拮抗作用： =====&lt;br /&gt;
赤霉素&amp;amp;脱落酸-平衡种子发芽&lt;br /&gt;
&lt;br /&gt;
独角金内酯&amp;amp;脱落酸-侧芽生长&lt;br /&gt;
&lt;br /&gt;
多胺&amp;amp;乙烯-竞争前体（SAM）&lt;br /&gt;
&lt;br /&gt;
植物生长促进剂（生长素、赤霉素、细胞分裂素、乙烯）&amp;amp;植物生长抑制剂（脱落酸、水杨酸、茉莉素）-逆转促进/抑制作用&lt;br /&gt;
&lt;br /&gt;
===== 抑制作用： =====&lt;br /&gt;
细胞分裂素→生长素-抑制顶端优势&lt;br /&gt;
&lt;br /&gt;
乙烯→生长素-抑制转运&lt;br /&gt;
&lt;br /&gt;
脱落酸→生长素-抑制运输&lt;br /&gt;
&lt;br /&gt;
水杨酸→乙烯-抑制ACC转变为乙烯&lt;br /&gt;
&lt;br /&gt;
茉莉酸→乙烯对黄化苗顶端弯勾形成的促进作用&amp;lt;small&amp;gt;&#039;&#039;&#039;&amp;lt;u&amp;gt;（追问：可以问一下此条来源吗？答：&amp;lt;/u&amp;gt;&#039;&#039;&#039;&amp;lt;/small&amp;gt;https://doi.org/10.1105/tpc.113.122002&amp;lt;small&amp;gt;&#039;&#039;&#039;&amp;lt;u&amp;gt;）&amp;lt;/u&amp;gt;&#039;&#039;&#039;&amp;lt;/small&amp;gt;&lt;br /&gt;
&lt;br /&gt;
乙烯→茉莉酸介导的植物伤害防御反应（通过加强茉莉酸代谢）&lt;br /&gt;
====想问一下有没有关于光合电子传递链抑制剂及其作用部位的整理，谢谢！====&lt;br /&gt;
这些在书上都有，王小菁《植物生理学》第八版第84页、武维华《植物生理学》第三版第131页，这些应该够用了，没见过考别的抑制剂的&lt;br /&gt;
&lt;br /&gt;
好的我被打脸了，补充一个：羟胺，作用于OEC，抑制水的裂解&lt;br /&gt;
&lt;br /&gt;
==== 根据水势的定义，水的移动方向应当是从水势高处流向水势低处，但是为什么《植物生理学》第八版（王小菁）第151页上的图里写的是水从水势-1.1兆帕流向水势-0.4兆帕？以及这张图应当是从Taiz的书上来的，按说是不会有问题的，但是不是很理解 ====&lt;br /&gt;
这是因为在筛管中，液体是直接流动的，而非渗透作用。&lt;br /&gt;
&lt;br /&gt;
如果液体是以渗透作用流动（即，需要以水分子的形式穿过一层膜），那么水就不可能逆水势流动。但现在，在筛管的两端之间没有任何阻拦，水以水流而非单个水分子的形式流动，就只考虑压力而不考虑水势了。&lt;br /&gt;
&lt;br /&gt;
如果不好理解，可以这样想：有两个杯子，一个高，一个低。高的水杯重力势高，但溶解了许多盐使水势低于低的杯子中的水。现在用管子把两个杯子连接，水自然会从高处的杯子流入低处的杯子，不会管你的水势到底谁高谁低。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;抗坏血酸氧化的磷氧比为什么是1呢？&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
抗坏血酸底物可以直接通过Cyt c 传递电子进行氧化，其 P/O比值接近&#039;&#039;&#039;1。（自wiki）&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
=== 进化生物学 ===&lt;br /&gt;
&lt;br /&gt;
==== fay and wu 的H 较tajima的d的优点？ ====&lt;br /&gt;
鉴于这两个我一个都不会算，于是去查维基百科，得到的结果如下：&lt;br /&gt;
&lt;br /&gt;
①两者都是借由计算差异位点（分离位点S）数目和采样对之间核苷酸差异的数量（这些称为成对差异）这些数据计算群体遗传参数θ后统计得出的统计量，前面的计算过程基本一致，只是最后的统计量采用了不同表示方法；&lt;br /&gt;
&lt;br /&gt;
②相较于D，H的优点在于，当群体内含有过多罕见多态性时，H能够在D的基础上给出在此情况下进化的方式（例如选择性清除等等），而不是仅仅给出非随机进化的结论，这个优势是基于H参考了外群数据，因此纳入了祖先性状，若与祖先性状一致则该位点可能是经历了负选择等等&lt;br /&gt;
&lt;br /&gt;
（当然这都是维基百科说的，[[:文件:Genetics1405.pdf|原文]]里面没看懂哪有外群，不过确实是区别了选择性清除和其他因素，至于计算这块儿我就爱莫能助了）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;人类进化分析为何不用x或常染色体？&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
一般只用mt或y，好像是因为不会重组&lt;br /&gt;
&lt;br /&gt;
=== 遗传学 ===&lt;br /&gt;
&#039;&#039;&#039;累加作用，积加作用，叠加作用在遗传比例方面的区别是什么呢？&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
累加作用：1:4：6:4：1&lt;br /&gt;
&lt;br /&gt;
积加：9:6：1&lt;br /&gt;
&lt;br /&gt;
叠加：15:1[[文件:半不育.png|缩略图]]&lt;br /&gt;
&lt;br /&gt;
==== 有关平衡易位杂合体“半不育”的疑问：理论上来说平衡易位杂合体可产生六种配子，其中仅两种是相间分离产生，即1/3配子可育而2/3配子不育。书上的叙述是利用50%配子不育的现象提出了易位，说明半不育是实验观察到的结果，是否有合理的解释为何1/3的可育配子在实际情况下变为50%可育？(来自重庆某高一生竞生） ====&lt;br /&gt;
如右图所示，平衡易位杂合体确实存在3种分离方式，但其发生概率并不相同；对于导致可育配子的相间分离和导致不育配子的相邻分离-1而言，其同源着丝粒相互分开，慨率较大且相等；对于导致不育的相邻分离-2而言，其同源着丝粒之间不分开，比较罕见。&lt;br /&gt;
&lt;br /&gt;
因此大体上看，主要会注意到相间分离和相邻分离-1，看起来确实接近一半的配子不育。&lt;br /&gt;
&lt;br /&gt;
==== 单倍体和一倍体明显的差异是什么呢？ ====&lt;br /&gt;
一倍和单倍这两个术语之间的区别微妙： 一倍染色体组是在多倍体系列的物种(如菊属)中成倍增加的基本染色体组。 单倍染色体组是存在于配子中的染色体集合，不管该物种的染色体数目是多少。 因为在二倍体生物中，一倍染色体组和单倍染色体组是一样的，所以可能出现混淆。想一 想四倍体，有助于弄清这一区别：四倍体含四个一倍染色体组，因而单倍体配子是二倍体。&lt;br /&gt;
&lt;br /&gt;
==== 人类染色体三体中，除了13、18、21、X、Y之外，还有哪些三体类型是可存活的？ ====&lt;br /&gt;
较少见的 8 号染色体三体、9 号染色体三体、22 号染色体三体亦可存活但表现异常；其余常染色体三体通常导致夭折。&lt;br /&gt;
&lt;br /&gt;
=== 生物技术 ===&lt;br /&gt;
&lt;br /&gt;
==== 如何制备emsa所用核酸探针？ ====&lt;br /&gt;
解答：要做EMSA首先要有参考基因组，然后化学合成/不对称PCR即可？&lt;br /&gt;
&lt;br /&gt;
=== 生态学 ===&lt;br /&gt;
&lt;br /&gt;
==== 为什么标志重捕法属于绝对密度测定，而捕捉属于相对密度测定；换言之，绝对密度测定与相对密度测定的区别到底是什么？ ====&lt;br /&gt;
绝对密度测定就是得出数据以后，所得数据指的是这个环境中物种密度的真实数据；相对测定就是说所得数据不是种群密度本身，而是一个可以反映种群密度的一个数据。&lt;br /&gt;
&lt;br /&gt;
举例，通过标志重捕法得出的数据是“432只/平方公里”这样的，是密度本身；但捕捉得出的数据只能是“一网能捞到三条鱼”，然后通过“一网三条鱼”来反映真实的密度（比如在15条鱼/平方米的情况下，一网恰好能捞到三条鱼）。&lt;br /&gt;
&lt;br /&gt;
类似的，“一小时能听到20次鸟叫”“一平方公里可以找到五十个粪堆”，都是不能直接得出种群密度，只能间接反映的，因此是相对密度测定。&lt;br /&gt;
&lt;br /&gt;
==== 生态学中用相邻个体最小距离检验分布型时，D=1/ (2N^{1/2})公式的推导过程？ ====&lt;br /&gt;
[[文件:屏幕截图 2024-11-14 190159.png|缩略图]]&lt;br /&gt;
（或许公式可以重新改一下下？有点不太明白）&lt;br /&gt;
&lt;br /&gt;
解答：&lt;br /&gt;
&lt;br /&gt;
在泊松分布中，有零个个体分布在指定的半径为r的区域内的概率P(零)=exp{-λπr²}&lt;br /&gt;
&lt;br /&gt;
因此，P(R≤r)=1-exp{-λπr²}&lt;br /&gt;
&lt;br /&gt;
其概率密度函数f(r)=2λπrexp{-λπr²} （根据P(x＜a)=∫(0→a)(f(x)) dx）&lt;br /&gt;
&lt;br /&gt;
所以距离的期望E(r)=∫(0→∞)r×f(r) dr=∫(0→∞)2λπr²exp{-λπr²} dr=1/(2λ^{1/2}).&lt;br /&gt;
&lt;br /&gt;
(该积分换元后使用Γ函数计算)（λ在这里表示分布密度，即图中的N）&lt;br /&gt;
&lt;br /&gt;
==== 什么是局域资源增强？ ====&lt;br /&gt;
当亲属互相帮助而不是相互竞争时，就会发生局部资源增强 (&#039;&#039;&#039;Local resource enhancement&#039;&#039;&#039; LRE)。在合作饲养者中，母亲会在先前的后代的帮助下抚养新的后代。在具有这些系统的动物中，如果帮手不足，预计雌性会优先生育帮助性别的后代。母亲调整后代性别比例的选择强度取决于它们从帮手那里获得的利益大小。&lt;br /&gt;
这些预测在非洲野狗身上得到了证实，雄性对它们的母亲更有帮助，因为它们与母亲留在同一个群体中，并帮助为母亲和她的新生后代提供食物.LRE 预计会导致性别比偏向雄性，这也是自然界中观察到的模式。&amp;lt;ref name=&amp;quot;:1&amp;quot;&amp;gt;[[wikipedia:Sex_allocation|Sex allocation - Wikipedia]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== 行为学 ===&lt;br /&gt;
&lt;br /&gt;
==== 空间出局雌性效应是什么？ ====&lt;br /&gt;
♀占有、积极保卫大领域，♂不能成功保卫足够领地支持多配制，致使婚配制度为单配制的现象。&lt;br /&gt;
&lt;br /&gt;
===生物信息===&lt;br /&gt;
&lt;br /&gt;
====求助！基于字符（或说基于性状/基于序列）的建树与基于距离的建树，其本质区别是什么？字符/性状/序列/距离是指什么？====&lt;br /&gt;
可以这样粗略的理解：&lt;br /&gt;
*基于字符，就是要具体分析序列中的基本单位是如何变化的，要具体到从某个残基变到了某个残基。&lt;br /&gt;
*基于距离，则不用这么具体，只需要知道不同的序列之间有多少不同即可。&lt;br /&gt;
*举个例子：最大似然法（ML）是基于字符的建树方式。那么在使用ML建树时，我们要具体分析从某个碱基变化到另外一个碱基的概率是多少。比方说从A-&amp;gt;T，在具体计算的时候要考虑这样变化的概率是多少？A-&amp;gt;G呢？通过这种方式，得出最可能的情况。当然实际计算要复杂的多。&lt;br /&gt;
*再举个例子：UPGMA法是基于距离的建树方式。在使用UPGMA法建树时，我们首先要列出不同序列之间距离的矩阵，然后根据距离从小到大聚类。在这种情况下，我们并不需要知道碱基具体是如何变化的。同样的，这只是基于距离建树防范中最简单的一种，实际情况肯定会更加复杂。&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E8%A3%B8%E5%AD%90%E6%A4%8D%E7%89%A9&amp;diff=5894</id>
		<title>裸子植物</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E8%A3%B8%E5%AD%90%E6%A4%8D%E7%89%A9&amp;diff=5894"/>
		<updated>2025-04-27T02:46:58Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== 总论 ==&lt;br /&gt;
[[File:914.png|thumb|243x243px|图1：裸子植物分类]]&lt;br /&gt;
* 裸子植物是种子植物中较低等的类群，一般分为苏铁纲（Cycadopsida）、银杏纲（Ginkgopsida）、松柏纲（Coniferopsida）。&lt;br /&gt;
* 过去认为，在从蕨类植物走向被子植物的过程中，三个类群是各自依次分支出来的，但现在的分子生物学认为裸子植物是作为一个单系群分支出来的。&lt;br /&gt;
* 银杏是源自石炭纪的活化石。&lt;br /&gt;
&lt;br /&gt;
== 分类系统 ==&lt;br /&gt;
•依照传统的分类系统，可分出大致如下几纲：&lt;br /&gt;
&lt;br /&gt;
苏铁纲--苏铁目--苏铁科、泽米铁科、蕨叶铁科（我们常&amp;lt;small&amp;gt;&amp;lt;s&amp;gt;（在书上）&amp;lt;/s&amp;gt;&amp;lt;/small&amp;gt;见到的&#039;&#039;Cycas&#039;&#039;属为苏铁科，&#039;&#039;Zamia&#039;&#039;属和&#039;&#039;Dioon&#039;&#039;属为泽米铁科）&lt;br /&gt;
&lt;br /&gt;
银杏纲--银杏目--银杏科&lt;br /&gt;
&lt;br /&gt;
红豆杉纲--红豆杉目、罗汉松目、三尖杉目（当然这是马炜梁、吴国芳教材说法，传统上此三目也合到松杉纲里去了）--红豆杉科、罗汉松科、三尖杉科&lt;br /&gt;
&lt;br /&gt;
松杉纲--松杉目--松科、柏科、杉科、南洋杉科&lt;br /&gt;
&lt;br /&gt;
买麻藤纲--麻黄目、买麻藤目、百岁兰目--麻黄科、买麻藤科、百岁兰科&lt;br /&gt;
&lt;br /&gt;
•依据2022年7月ScienceDirect上的一篇文章，现存裸子植物分成了三大纲：苏铁纲、银杏纲、松柏纲。&lt;br /&gt;
[[文件:GP Tree Ch-En.png|缩略图|我花了一个小时用PS手打的翻译……]]&lt;br /&gt;
&lt;br /&gt;
== 苏铁纲 ==&lt;br /&gt;
[[File:913.png|thumb|220x220px|图2：苏铁]]&lt;br /&gt;
[[File:915.png|thumb|238x238px|图3：苏铁]]&lt;br /&gt;
[[File:916.png|thumb|220x220px|图4：苏铁的孢子球]]&lt;br /&gt;
[[File:917.png|thumb|220x220px|图5：苏铁的雄配子体（图a为一个小孢子）]]&lt;br /&gt;
[[File:918.png|thumb|220x220px|图6：苏铁的雌配子体]]&lt;br /&gt;
* 苏铁的主茎不分支，顶部一圈长出螺旋排列的羽状叶。&lt;br /&gt;
* 苏铁的茎的髓富含淀粉，木射线很宽，茎可以和蓝藻共生，蓝藻可以为植物固氮。&lt;br /&gt;
* 苏铁的叶角质层很厚，有凹陷的气孔，叶的顶端可以不断生长，叶或其两侧的羽片可以像蕨类植物一样卷曲。&lt;br /&gt;
* 苏铁是雌雄异体，孢子叶球（图3、图4）长在茎的顶端中心，它是大量变态叶的聚合。&lt;br /&gt;
* 孢子叶球不能无限生长，每个雄孢子叶呈鳞片状，小孢子囊（Microsporangium）分布在孢子叶四周，它最少可以只有5个，最多有约1000个。&lt;br /&gt;
* 孢子囊的发育方式与被子植物类似：&lt;br /&gt;
** 首先位于亚表皮层的一个细胞变为孢原细胞（Archespore），它径向分裂形成初生壁细胞和初生造孢细胞。&lt;br /&gt;
** 初生壁细胞经过多次分裂，形成4-7层壁，最内层是绒毡层（Tapetum）。&lt;br /&gt;
** 表皮细胞产生很厚的细胞壁，此时它被称为药室外壁（Exothecium）。&lt;br /&gt;
** 初生造孢细胞产生大量造孢细胞，其中进入减数分裂准备阶段的称为小孢子母细胞。&lt;br /&gt;
* 孢子囊中，小孢子母细胞（Microsporocyte）减数分裂产生4个花粉细胞（Pollen Cell，实际上是小孢子），这个细胞不等分裂产生原叶细胞（Prothallium Cell）和胚性细胞（Anteridium Cell）。&lt;br /&gt;
* 胚性细胞再分裂形成花粉管细胞（Pollen Tube Cell）和生殖细胞（Generative Cell）。&lt;br /&gt;
* 生殖细胞分裂产生柄细胞（Stalk Cell）和生精细胞（Spermatogenic Cell）。&lt;br /&gt;
* 最后生精细胞分裂形成2个精子（Spermatozoid）。&lt;br /&gt;
* 苏铁的精子是植物界最大的精子，比动物界的所有精子都大。它有鞭毛，可以运动。&lt;br /&gt;
* 当雄配子体从配子囊释放时，生精细胞尚未分裂，配子体只有4个细胞。&lt;br /&gt;
* 雌孢子叶球中，每个孢子叶由两部分组成，靠上部分有羽状分裂，靠下部分没有，只有附着的胚珠（Ovule）。&lt;br /&gt;
* 胚珠由一层珠被（这与被子植物不同，它们有两层珠被）和珠心组织组成，珠心组织内包着雌配子体，苏铁的雌配子体有几千个细胞，可能是植物界最大的雌配子体。&lt;br /&gt;
* 珠被顶端有一个小孔（珠孔，Micropyle），花粉从此落入胚珠。&lt;br /&gt;
* 雌配子体的发育：&lt;br /&gt;
** 雌配子体发育的起点是合点（胚珠与大孢子叶相连处）。&lt;br /&gt;
** 珠心组织的亚表皮层产生一至多个孢原细胞。&lt;br /&gt;
** 孢原细胞径向分裂产生初生壁细胞和初生造孢细胞。&lt;br /&gt;
** 初生壁细胞大量分裂，产生的壁非常发达。&lt;br /&gt;
** 初生造孢细胞经过一至两次分裂产生大孢子母细胞，它们减数分裂形成线形排列的3-4个细胞（因为第一次减数分裂产生的一个细胞可能不发生第二次减数分裂），通常最底部的一个细胞形成配子体，其它细胞退化。&lt;br /&gt;
** 大孢子的细胞核反复分裂而无细胞质分裂，可形成几百至几千个细胞核。&lt;br /&gt;
** 等到细胞核分裂阶段结束，各细胞核之间才开始形成细胞壁，从大孢子的边缘开始向内形成。&lt;br /&gt;
** 雌配子体的中心会形成一个空腔（Corrosion Cavity），用于储存营养。&lt;br /&gt;
** 位于珠孔处的一些细胞，径向分裂形成一个较大的中央细胞（Central Cell）和一个较小的颈原始细胞（Neck Initial），后者再分裂形成2个颈细胞，这是裸子植物高度退化的颈卵器。&lt;br /&gt;
** 苏铁一般形成2-6个颈卵器，有些物种可形成100个。&lt;br /&gt;
** 颈卵器上分的一些细胞先膨大，再凋亡，留下一个珠心组织和配子体之间的空腔，称为颈卵器腔（Archegonial Chamber）。&lt;br /&gt;
** 珠孔处，珠心组织的一些细胞凋亡，分泌出一种黏性液体（主要包含水、糖类、氨基酸），称为受粉滴（Pollination Drop），用于捕捉花粉，凋亡的细胞形成花粉腔（Pollen Chamber）。&lt;br /&gt;
* 受精：&lt;br /&gt;
** 花粉被受粉滴黏住后，珠心组织重新吸收受粉滴，将花粉拖入珠被之下。&lt;br /&gt;
** 花粉嵌入珠心组织，然后花粉管细胞不断生长，生精细胞分裂为2个精子，其中一个通过花粉管细胞，经过颈卵器腔，到达颈卵器，在颈细胞的帮助下与卵细胞融合，另一个被消化。&lt;br /&gt;
** 雌配子体剩下的细胞用于为种子提供营养，所以称为裸子植物的胚乳（Endosperm），注意它是单倍体。&lt;br /&gt;
&lt;br /&gt;
== 银杏纲 ==&lt;br /&gt;
[[File:919.png|thumb|299x299px|图7：银杏]]&lt;br /&gt;
* 银杏纲的化石很丰富，但现存物种只剩一个，银杏（Ginkgo biloba）。&lt;br /&gt;
* 银杏是落叶植物，茎高度分支，叶往往聚在短枝（Short Shoot）上，见图7。&lt;br /&gt;
* 银杏是雌雄异体，并且没有类似其它裸子植物的孢子叶结构。&lt;br /&gt;
* 雄性个体中，短枝上长出葇荑花序形状的花粉锥（Pollen Cone）。&lt;br /&gt;
* 花粉锥的主干上伸出许多分支，每个的末端生2个小孢子囊。&lt;br /&gt;
* 雌性个体中，短枝上伸出一个不分支的大孢子叶，其末端生有2个大孢子囊。&lt;br /&gt;
* 银杏的生殖仍然保留了很多原始特征，包括精子有鞭毛可以运动，和珠孔处有花粉腔和颈卵器腔。&lt;br /&gt;
* 银杏的雄配子体中，花粉细胞要分裂2次形成2个原叶细胞。&lt;br /&gt;
* 银杏花粉的表皮不形成药室外壁，其辅助开裂功能是由表皮亚层形成的药室内壁（Endothecium）形成的，这比较像被子植物，在裸子植物中是特例。&lt;br /&gt;
* 银杏的种皮，外种皮肉质，中种皮骨质，内种皮膜质&lt;br /&gt;
&lt;br /&gt;
== 松柏纲 ==&lt;br /&gt;
[[File:920.png|thumb|284x284px|图8：松科]]&lt;br /&gt;
[[File:921.png|thumb|262x262px|图9：松科的孢子叶球]]&lt;br /&gt;
[[File:922.png|thumb|289x289px|图10：松科]]&lt;br /&gt;
[[File:923.png|thumb|296x296px|图11：柏树和杉树]]&lt;br /&gt;
* 松柏纲和银杏纲中，叶都从苏铁的羽状叶，变成了简单叶。&lt;br /&gt;
* 松柏纲的精子失去了鞭毛，不能运动。&lt;br /&gt;
* 松柏纲的胚珠的花粉腔和颈卵器腔消失，精子完全通过花粉管接触卵子。&lt;br /&gt;
* 松柏纲的大孢子叶球有种鳞（Ovuliferous Scale）和苞鳞两部分组成，只有种鳞能产生胚珠。（见图9）&lt;br /&gt;
* 松柏纲的种子常有很多个子叶。&lt;br /&gt;
* 松柏纲主要包含松科（Pinaceae）和柏科（Cupressaceae），过去承认的杉科（Taxodiaceae）现在归入柏科，此外买麻藤类（Gnetales）现在根据分子生物学证据归入松柏纲。&lt;br /&gt;
&lt;br /&gt;
=== 松 ===&lt;br /&gt;
* 松一般为乔木，都是雌雄异体，根部有外寄生的真菌，叶轮生，一般无柄或很短，条形或针形。&lt;br /&gt;
* 叶分化为光合叶和非光合叶，光合叶呈绿色，着生于短枝，有时簇生；而非光合叶为褐色，着生于长枝。&lt;br /&gt;
* 小孢子叶球着生于短枝基部，单个存在或成群，小孢子叶轮生，每个在下侧（远轴面）有2个小孢子囊。&lt;br /&gt;
* 大孢子叶球长在长枝的边上或末端，大孢子叶（种鳞）轮生，每个在上侧（近轴面）有2个大孢子囊，它与下侧的苞鳞离生，大孢子叶常木质化。&lt;br /&gt;
* 当花粉被释放时，一般雌配子体还没成熟，花粉落在大孢子叶上后要到第2年才受精，而种子成熟释放要等到第3年。&lt;br /&gt;
* 松的花粉常有气囊结构，种子常有翅结构，都是为了辅助传播。&lt;br /&gt;
* 有些干旱森林中的物种，只有发生森林火灾时大孢子囊才开裂。&lt;br /&gt;
&lt;br /&gt;
=== 柏 ===&lt;br /&gt;
* 乔木或灌木，雌雄同体或雌雄异体，根部常有真菌共生（囊丛枝菌根），茎为单轴分支，侧枝常变扁，叶无柄或有柄，轮生或对生，条形或针形，成熟的呈鳞片状。&lt;br /&gt;
* 小孢子叶球和大孢子叶球都长在枝的末端，一般不成群，小孢子叶下侧有2-10个小孢子囊，大孢子叶在上侧有2-20个胚珠。&lt;br /&gt;
* 种鳞和苞鳞合成（Adnate），在杉中被称为半合生。&lt;br /&gt;
* 花粉没有气囊结构，但种子常有翅。&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%97%85%E6%AF%92%E5%88%86%E7%B1%BB%E6%95%B4%E7%90%86&amp;diff=5197</id>
		<title>病毒分类整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%97%85%E6%AF%92%E5%88%86%E7%B1%BB%E6%95%B4%E7%90%86&amp;diff=5197"/>
		<updated>2025-03-24T08:04:52Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* 各种病毒的基因组类型总结 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== 各种病毒的基因组类型总结 ==&lt;br /&gt;
dsDNA:（天花，牛痘）,HPV,(水痘，带状疱疹，巨细胞病毒CMV)，腺病毒；大多数噬菌体；猿猴病毒40（SV40）&lt;br /&gt;
&lt;br /&gt;
ssDNA：细小病毒（腺联病毒AAV），鼻病毒，玉米条纹病毒，核盘菌SsHADV-1病毒&lt;br /&gt;
&lt;br /&gt;
dsRNA：呼肠孤病毒（轮状病毒），昆虫质型多角体病毒，玉米矮缩病毒，真菌病毒（核盘菌除外）&lt;br /&gt;
&lt;br /&gt;
+ssRNA：冠状病毒（日冕病毒），脊髓灰质炎，黄病毒（黄热病，乙脑，登革热，丙肝，寨卡），风疹，乙肝丁肝以外的所有肝炎病毒；烟草花叶病毒TMV&lt;br /&gt;
&lt;br /&gt;
-ssRNA：狂犬病，腮腺炎，流感，麻疹，埃博拉，丁肝，汉坦&lt;br /&gt;
&lt;br /&gt;
反转录ssRNA：HIV&lt;br /&gt;
&lt;br /&gt;
反转录dsDNA：乙肝，花椰菜花叶病毒CaMV&lt;br /&gt;
&lt;br /&gt;
* 总结：DNA大多双链除了细小，RNA大多单链除了呼肠孤；负链包括“狂塞遛马爱丁汉”（狂腮流麻埃丁汉）（在狂风大作的塞外遛马的来自爱丁堡的汉子）。正链包括“观日几恼黄热风”（冠日脊脑黄热风）（他在观看日出时好几次因为黄热的风而感到气恼）（黄热代表了好几个黄病毒科的物种）。&lt;br /&gt;
&lt;br /&gt;
== 病毒分类法 ==&lt;br /&gt;
&lt;br /&gt;
=== ICTV 分类法 ===&lt;br /&gt;
国际病毒分类委员会（ICTV）是国际微生物学联合会发展、改进和维护通用病毒分类的唯一机构，在1966年建立起了一个病毒分类的通用系统和统一的命名法则。第七届 ICTV 会议首次规范化了病毒物种的概念，即病毒分类的分支层次中的最低分类单元。分类的主要依据是病毒颗粒的特性、抗原特性与生物特性。&lt;br /&gt;
&lt;br /&gt;
到目前为止只有一小部分的病毒得到了研究，从来自人体的病毒样品中发现有20%的序列是未曾发现过的，而来自环境中（如海水、大洋沉积物等）的病毒样品则大部分的序列都是全新的。&lt;br /&gt;
&lt;br /&gt;
病毒分类从域开始，结构如下，分类后缀在括号中：&lt;br /&gt;
:域 Realm（&#039;&#039;-viria&#039;&#039;）&lt;br /&gt;
::亚域 Subrealm（&#039;&#039;-vira&#039;&#039;）&lt;br /&gt;
:::界 Kingdom（&#039;&#039;-viriae&#039;&#039;）&lt;br /&gt;
::::亚界 Subkingdom（&#039;&#039;-virites&#039;&#039;）&lt;br /&gt;
:::::门 Phylum（&#039;&#039;-viricota&#039;&#039;）&lt;br /&gt;
::::::亚门 Subphylum（&#039;&#039;-viricotina&#039;&#039;）&lt;br /&gt;
:::::::纲 Class（&#039;&#039;-viricetes&#039;&#039;）&lt;br /&gt;
::::::::亚纲 Subclass（&#039;&#039;-viricetidae&#039;&#039;）&lt;br /&gt;
:::::::::目 Order（&#039;&#039;-virales&#039;&#039;）&lt;br /&gt;
::::::::::亚目 Suborder（&#039;&#039;-virineae&#039;&#039;）&lt;br /&gt;
:::::::::::科 Family（&#039;&#039;-viridae&#039;&#039;）&lt;br /&gt;
::::::::::::亚科 Subfamily（&#039;&#039;-virinae&#039;&#039;）&lt;br /&gt;
:::::::::::::属 Genus（&#039;&#039;-virus&#039;&#039;）&lt;br /&gt;
::::::::::::::亚属 Subgenus（&#039;&#039;-virus&#039;&#039;）&lt;br /&gt;
:::::::::::::::种 Species&lt;br /&gt;
&lt;br /&gt;
ICTV 2020版分类表中总共有6个域、10个界、17个门、2个亚门、39个纲、59个目、8个亚目、189个科、136个亚科、2224个属、70个亚属与9110个种。除亚域、亚界和亚纲外，其他级别的分类单元都被使用。共有6个域、1个地位未定纲、19个地位未定科及2个地位未定属被承认。&lt;br /&gt;
&lt;br /&gt;
=== 巴尔的摩分类法 ===&lt;br /&gt;
诺贝尔奖获得者生物学家戴维·巴尔的摩在1970年代提出了巴尔的摩分类系统。巴尔的摩分类法与ICTV分类法一起用于现代病毒的分类。&lt;br /&gt;
&lt;br /&gt;
巴尔的摩分类法是基于病毒 mRNA 的生成机制。在从病毒基因组到蛋白质的过程中，必须要生成mRNA来完成蛋白质合成和基因组的复制，但每一个病毒家族都采用不同的机制来完成这一过程。病毒基因组可以是单链或双链的 RNA 或 DNA，可以有也可以没有反转录酶。而且，单链RNA病毒可以是正义（+）或反义（-）。这一分类法将病毒分为7类：&lt;br /&gt;
&lt;br /&gt;
*第一类是双链 DNA 病毒（如腺病毒、疱疹病毒、痘病毒）&lt;br /&gt;
*第二类是单链 DNA 病毒（+）DNA（如小 DNA 病毒）&lt;br /&gt;
*第三类是双链RNA病毒（如呼肠孤病毒）&lt;br /&gt;
*第四类是（+）单链RNA病毒（如微小核糖核酸病毒、披盖病毒、甲肝病毒、丙肝病毒、黄热病毒、鼻病毒、脊髓灰质炎病毒、风疹病毒）&lt;br /&gt;
*第五类是（-）单链RNA病毒（如正黏液病毒（流感病毒）、炮弹病毒）&lt;br /&gt;
*第六类是单链RNA反转录病毒（如反转录病毒、人类免疫缺陷病毒）&lt;br /&gt;
*第七类是双链 DNA 反转录病毒（如乙肝病毒）&lt;br /&gt;
举一个病毒分类的例子：水痘病毒，即带状疱疹病毒，属于疱疹病毒目，疱疹病毒科，甲型疱疹病毒亚科，水疱病毒属；同时，带状疱疹病毒是巴尔的摩分类法中的第一类，因为它是双链 DNA 病毒，且不含有反转录酶。&lt;br /&gt;
物种名称通常以[疾病]病毒的形式出现，尤其是高等动植物。&lt;br /&gt;
&amp;lt;ref&amp;gt;[https://zh.wikipedia.org/wiki/病毒分类表 病毒分类表-维基百科]&amp;lt;/ref&amp;gt;&lt;br /&gt;
== 卫星 ==&lt;br /&gt;
卫星（Satellite）是亚病毒因子的一类，不能单独存在，需要辅助病毒协助复制核酸，或者由辅助病毒提供衣壳蛋白来包被核酸。分为两大类：能利用自己核酸编码衣壳蛋白的为卫星病毒，不能的则称卫星核酸。如丁型肝炎病毒(HDV)必须利用乙型肝炎病毒的包膜蛋白才能完成复制周期，常见的卫星病毒还有腺联病毒(AAV)、卫星烟草花叶病毒(STMV)、卫星玉米白线花叶病毒(SMWLMV)、卫星稷子花叶病毒（SPMV)等。&lt;br /&gt;
== 类病毒 ==&lt;br /&gt;
类病毒（Viroid）是一种具有传染性的单链环状RNA病原体。它比病毒要小，且没有典型病毒所有的蛋白质外壳。类病毒为严格寄生物，专一性很强。目前所有已知的类病毒均为被子植物栖居者，且多数造成疾病；它们通常透过种子或花粉传播，且整合到细胞核内进行复制。&lt;br /&gt;
类病毒最早由在美国工作的瑞士学者迪纳（Theodor O. Diener）于1971年在马铃薯纺锤块茎病中发现。&lt;br /&gt;
&lt;br /&gt;
== 拟病毒 ==&lt;br /&gt;
拟病毒又称类类病毒，使指一类包裹在真病毒粒中的有缺陷的类病毒。拟病毒极其微小，一般仅由裸露的RNA组成。与拟病毒“共生”的真病毒又称辅助病毒，拟病毒则成了它的“卫星”。拟病毒的复制必须依赖辅助病毒的协助。同时，拟病毒也可干扰辅助病毒的复制和减轻其对宿主的病害，因此，它可用于生物防治中。&lt;br /&gt;
&lt;br /&gt;
== 朊病毒 ==&lt;br /&gt;
朊病毒是一种具感染性的致病因子，能引发哺乳动物的传染性海绵状脑病。朊毒体疾病（传染性海绵状脑病）和阿尔茨海默病、帕金森病同属于神经退行性疾病。最早发现于哺乳动物的传染性海绵状脑病，包括羊搔痒症、疯牛病、慢性消耗病，以及人类的克雅二氏病。它不是病毒，而是仅由蛋白质构成的致病因子。它虽然不含核酸，但可自我复制且具有感染性。朊病毒由错误折叠的朊蛋白（PrP）聚集组成。它能够诱导在神经细胞上原本是正常结构的朊蛋白转变为错误结构并进行聚集反应，借由这个机制引入新的朊蛋白，不断自我复制并传递至邻近细胞，最终扩散至整个脑部。&lt;br /&gt;
&lt;br /&gt;
== 病毒进化史的一个有趣的假说&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt; ==&lt;br /&gt;
[[文件:进化史.png|缩略图|&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.bilibili.com/read/cv5205466/?from=readlist 病毒进化史]&amp;lt;/ref&amp;gt;]]&lt;br /&gt;
事先声明：以下内容只是一个B站博主的文章，作者已经写明只是个人猜测，并且没有给出参考文献，更不是论文或教材。所谓的进化路线没有经过严谨证明，可以当作一个帮助记忆的方法，千万不要将其视为权威资料！&lt;br /&gt;
&lt;br /&gt;
作者对其提出的进化路线给出的理由如下：&lt;br /&gt;
&lt;br /&gt;
1，类病毒与德尔塔病毒(以下简称丁肝病毒)繁殖方式一样，只是丁肝病毒多了一个德尔塔抗原。(蛇丁肝病毒多了一个疑似德尔塔棘突蛋白)&lt;br /&gt;
&lt;br /&gt;
2，丁肝病毒的RNA是反义RNA，繁殖方式与反义RNA病毒一样(丁肝病毒：转录——德尔塔抗原催化RNA复制；反义RNA病毒：转录——基质蛋白催化RNA复制)&lt;br /&gt;
&lt;br /&gt;
3，丁肝病毒生活需要细胞的DNA依赖的RNA聚合酶（主要是RNA聚合酶II——转录mRNA的RNA聚合酶）进行RNA复制（可见细胞的RNA聚合酶祖先是RNA依赖的RNA聚合酶）&lt;br /&gt;
&lt;br /&gt;
4，正义RNA病毒、反义RNA病毒的RNA依赖的RNA聚合酶与逆转录病毒的逆转录酶拥有共同结构。&lt;br /&gt;
&lt;br /&gt;
5，正义RNA病毒RNA复制时首先形成双链RNA，然后双链RNA转录形成正义RNA；双链RNA病毒首先进行转录形成正义RNA，最终正义RNA转录成为双链RNA，可谓是“师出同门”&lt;br /&gt;
&lt;br /&gt;
6，正义RNA病毒复制时在细胞内形成小体，双链RNA病毒可直接作为小体&lt;br /&gt;
&lt;br /&gt;
7，反义RNA病毒复制时不形成双链RNA，与正义RNA病毒完全不同&lt;br /&gt;
&lt;br /&gt;
8，人体内有内源性博尔纳病毒基因(EBLN-1/2/3P)，而博尔纳病毒正是反义RNA病毒，可见反义RNA病毒可以整合在宿主DNA基因组中，这与逆转录病毒是一样的（可见，反义RNA病毒是逆转录病毒的祖先）&lt;br /&gt;
&lt;br /&gt;
9，反义RNA病毒、逆转录病毒、拟逆转录病毒、单链DNA病毒与双链DNA病毒均可以通过内含子剪辑RNA来改变外显子的表达，这与细胞是一样的&lt;br /&gt;
&lt;br /&gt;
10，逆转录病毒中的泡沫病毒有20%的概率会形成拥有双链DNA的病毒，这种病毒的生活方式与乙肝病毒一样（泡沫病毒中拥有双链DNA的病毒遗传信息流与乙肝病毒均为DNA→RNA→DNA，泡沫病毒中拥有双正义RNA的病毒遗传信息流为RNA→DNA→RNA）&lt;br /&gt;
&lt;br /&gt;
11，乙肝病毒（DR1与DR2）、花椰菜花叶病毒（19S与35S）的DNA上均有两个正向重复序列（direct repeat），用以mRNA转录、pgRNA合成与病毒DNA合成。逆转录病毒的DNA上也有两个重复序列（long terminal repeat），用以mRNA转录、正义RNA合成与病毒DNA合成&lt;br /&gt;
&lt;br /&gt;
12，无论是像HIV的逆转录病毒（retrovirus），还是像乙肝病毒的拟逆转录病毒（pararetrovirus），它们合成双链DNA的逆转录过程中，均会形成单链DNA，而且单链DNA也含有重复序列。而腺相关病毒这种无害的人细小病毒的单链DNA也含有重复序列（inverted repeat）&lt;br /&gt;
&lt;br /&gt;
13，无论是拥有线型单链DNA的腺相关病毒，还是拥有环状单链DNA的M13噬菌体，它们均拥有重复序列以作为启动子&lt;br /&gt;
&lt;br /&gt;
14，人体细胞内的DNA很多都是逆转录病毒（少数为反义RNA病毒）整合而来&lt;br /&gt;
&lt;br /&gt;
15，反义RNA病毒的RNA依赖的RNA聚合酶与逆转录酶、DNA聚合酶和RNA聚合酶结构相似&lt;br /&gt;
&lt;br /&gt;
16，非洲猪瘟病毒与原始细胞的DNA聚合酶均缺失外切酶修复校正功能，由此可知，原始细胞由原始双链DNA病毒进化而来。&lt;br /&gt;
&lt;br /&gt;
17，原始DNA病毒的DNA聚合酶开始没有外切酶修复校正功能，修复校正功能是后期进化而来。原始细胞的DNA细胞的DNA聚合酶也是如此&lt;br /&gt;
&lt;br /&gt;
18，最早出现的外切酶修复校正功能为3&#039;→5&#039;外切酶，最晚出现的外切酶修复校正功能为5&#039;→3&#039;外切酶。&lt;br /&gt;
&lt;br /&gt;
19，真核细胞的染色体与现代双链DNA病毒的DNA均为线型，而细胞的末端为由重复序列组成的端粒，现代双链DNA病毒DNA的末端为重复序列。&lt;br /&gt;
&lt;br /&gt;
20，真核细胞的端粒上有端粒酶用以合成替换引物的DNA，腺病毒的DNA末端有磷蛋白作为DNA复制的引物&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E8%AE%A8%E8%AE%BA:%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=5164</id>
		<title>讨论:生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E8%AE%A8%E8%AE%BA:%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=5164"/>
		<updated>2025-03-23T09:00:00Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;背所谓的“搞人小数据库”还不如去NAR（《nuclear acid research》）每年第一刊狂背😅😅😅，一年几百个背去吧孩子😋😋😋[[用户:Astelle|Astelle]]（[[用户讨论:Astelle|留言]]） 2025年3月20日 (四) 18:46 (CST)&lt;br /&gt;
非常抱歉，&lt;br /&gt;
我不知道我做了什么让你不开心的事情，但希望你对我说这些能让你开心吧&lt;br /&gt;
如果我写了不对劲的东西，希望能斧正。如果你有更好的方案，也希望你可以分享&lt;br /&gt;
额我不是这个意思，我是说这些数据库不用管。不用在上面耗时间（仅限“搞人小数据库”那几个）&lt;br /&gt;
外培的时候被这些东西搞过所以记下来了qwq，谢谢大佬&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E8%AE%A8%E8%AE%BA:%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=5119</id>
		<title>讨论:生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E8%AE%A8%E8%AE%BA:%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=5119"/>
		<updated>2025-03-21T04:35:13Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;背所谓的“搞人小数据库”还不如去NAR（《nuclear acid research》）每年第一刊狂背😅😅😅，一年几百个背去吧孩子😋😋😋[[用户:Astelle|Astelle]]（[[用户讨论:Astelle|留言]]） 2025年3月20日 (四) 18:46 (CST)&lt;br /&gt;
非常抱歉，&lt;br /&gt;
我不知道我做了什么让你不开心的事情，但希望你对我说这些能让你开心吧&lt;br /&gt;
如果我写了不对劲的东西，希望能斧正。如果你有更好的方案，也希望你可以分享&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E8%AE%A8%E8%AE%BA:%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=5118</id>
		<title>讨论:生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E8%AE%A8%E8%AE%BA:%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=5118"/>
		<updated>2025-03-21T04:24:32Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;背所谓的“搞人小数据库”还不如去NAR（《nuclear acid research》）每年第一刊狂背😅😅😅，一年几百个背去吧孩子😋😋😋[[用户:Astelle|Astelle]]（[[用户讨论:Astelle|留言]]） 2025年3月20日 (四) 18:46 (CST)&lt;br /&gt;
非常抱歉，我不知道我做了什么让你不开心的事情，但希望你对我说这些能让你开心吧&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E6%AF%94%E5%AF%B9%E7%AE%97%E6%B3%95&amp;diff=5054</id>
		<title>比对算法</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E6%AF%94%E5%AF%B9%E7%AE%97%E6%B3%95&amp;diff=5054"/>
		<updated>2025-03-20T00:06:23Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;介绍三种关于序列比对的算法，矩阵，进化树与更多&lt;br /&gt;
&lt;br /&gt;
== 相似与一致与同源 ==&lt;br /&gt;
&lt;br /&gt;
* 一致度：如果两个序列（蛋白质或核酸）长度相同，那么它们的一致度定义为对应位置上相同的残基（氨基酸或碱基）的数目占总长度的百分比。&lt;br /&gt;
* 相似度：如果两个序列长度相同，则相似度定义为它们对应位置上相似的残基与相同的残基的数目和占总长度的百分数。&lt;br /&gt;
* 同源性只能用有没有来形容，不能说“70%同源”这种胡话，类似于“这个布尔函数&amp;lt;ref&amp;gt;布尔函数是信息技术课上的一种数据存储形式&lt;br /&gt;
&lt;br /&gt;
只有0和正数两种值&amp;lt;/ref&amp;gt;有80%是0”&lt;br /&gt;
* 也就是说，一致度要求完全一样，相似度只要性质差不多也能算进去&lt;br /&gt;
&lt;br /&gt;
== 比对类型 ==&lt;br /&gt;
局部比对找出两个序列中高相似度的片段&lt;br /&gt;
&lt;br /&gt;
全局比对构建打分矩阵，打分。。。&lt;br /&gt;
&lt;br /&gt;
半局部比对对一条序列使用局部比对，另一条使用全局比对，如此求得最大匹配度&lt;br /&gt;
&lt;br /&gt;
== 比对矩阵 ==&lt;br /&gt;
如果希望对蛋白质或核酸序列进行比对，需要借助于矩阵（对于计分表的更高端叫法）打分，分高者相似&lt;br /&gt;
&lt;br /&gt;
=== 核酸矩阵 ===&lt;br /&gt;
&lt;br /&gt;
==== 等价矩阵 ====&lt;br /&gt;
将一致的计算为一分，不一致的计算为0分&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|+等价矩阵 &lt;br /&gt;
!&lt;br /&gt;
!A&lt;br /&gt;
!T&lt;br /&gt;
!C&lt;br /&gt;
!G&lt;br /&gt;
|-&lt;br /&gt;
!A&lt;br /&gt;
!1&lt;br /&gt;
!0&lt;br /&gt;
!0&lt;br /&gt;
!0&lt;br /&gt;
|-&lt;br /&gt;
|T&lt;br /&gt;
|0&lt;br /&gt;
|1&lt;br /&gt;
|0&lt;br /&gt;
|0&lt;br /&gt;
|-&lt;br /&gt;
|C&lt;br /&gt;
|0&lt;br /&gt;
|0&lt;br /&gt;
|1&lt;br /&gt;
|0&lt;br /&gt;
|-&lt;br /&gt;
|G&lt;br /&gt;
|0&lt;br /&gt;
|0&lt;br /&gt;
|0&lt;br /&gt;
|1&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
==== BLAST矩阵 ====&lt;br /&gt;
将一致的计算为+4分，不一致的计算为-5分&lt;br /&gt;
&lt;br /&gt;
和上一张差不多&lt;br /&gt;
&lt;br /&gt;
转换/颠换矩阵&amp;lt;ref&amp;gt;转换指的是嘌呤换嘌呤，嘧啶换嘧啶&lt;br /&gt;
&lt;br /&gt;
颠换指的是嘌呤换嘧啶(这么基础感觉没必要多嘴啊w)&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
将一致的计+1，转换计算-1，颠换计算-5&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|+&lt;br /&gt;
!&lt;br /&gt;
!A&lt;br /&gt;
!T&lt;br /&gt;
!C&lt;br /&gt;
!G&lt;br /&gt;
|-&lt;br /&gt;
!A&lt;br /&gt;
!1&lt;br /&gt;
!-5&lt;br /&gt;
!-5&lt;br /&gt;
!-1&lt;br /&gt;
|-&lt;br /&gt;
|T&lt;br /&gt;
| -5&lt;br /&gt;
|1&lt;br /&gt;
| -1&lt;br /&gt;
| -5&lt;br /&gt;
|-&lt;br /&gt;
|C&lt;br /&gt;
| -5&lt;br /&gt;
| -1&lt;br /&gt;
|1&lt;br /&gt;
| -5&lt;br /&gt;
|-&lt;br /&gt;
|G&lt;br /&gt;
| -1&lt;br /&gt;
| -5&lt;br /&gt;
| -5&lt;br /&gt;
|1&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质矩阵 ===&lt;br /&gt;
&lt;br /&gt;
==== PAM矩阵 ====&lt;br /&gt;
PAM矩阵是目前蛋白质序列比较中最广泛使用的记分方法之一，基础的PAM-1 矩阵反应的是进化产生的&#039;&#039;&#039;每一百个氨基酸平均发生一个突变的量值（统计方法得到）&#039;&#039;&#039;。&lt;br /&gt;
&lt;br /&gt;
PAM-1是由相似度大于85%的序列计算产生&lt;br /&gt;
&lt;br /&gt;
PAM-1 自乘n次，可以得到PAM-n，即发生了多次突变。也就是说PAM越大，相似度越小&lt;br /&gt;
&lt;br /&gt;
==== BLOSUM矩阵 ====&lt;br /&gt;
BLOSUM 矩阵都是通过对大量符合特定要求的序列计算而来。如BLOSUM62表示计算了相似度&amp;gt;62%的蛋白质序列得到结果&lt;br /&gt;
[[文件:屏幕截图(8).png|缩略图|比较PAM和BLOSUM]]&lt;br /&gt;
&lt;br /&gt;
==== GCM矩阵/遗传密码子矩阵 ====&lt;br /&gt;
两个氨基酸之间密码子所需的突变次数越多，替换代价越大（多用于进化树）&lt;br /&gt;
&lt;br /&gt;
==== 疏水矩阵 ====&lt;br /&gt;
疏水性相近的氨基酸得分更高&lt;br /&gt;
&lt;br /&gt;
== 比对序列 ==&lt;br /&gt;
&lt;br /&gt;
=== 动态规划 ===&lt;br /&gt;
核心原理是，如果你每一步都是最优解，那最后也一定是最优解&lt;br /&gt;
&lt;br /&gt;
也就是说，因为你在列表走格子的时候每次都取了最优解，所以比对结果也应该是最优解&lt;br /&gt;
&lt;br /&gt;
1950由理查德贝尔曼开发&lt;br /&gt;
&lt;br /&gt;
=== 打点法 ===&lt;br /&gt;
[[文件:序列比对笑传之compare cat brothers.png|缩略图|compare cat brothers]]&lt;br /&gt;
首先您需要找到两条序列THEFASTCAT和THEFATCAT&lt;br /&gt;
&lt;br /&gt;
将他们将两条序列用这一张图中的方法分别列出，形成一个二维表格，在字母相同（实际上是氨基酸相同）的位置打上点&lt;br /&gt;
&lt;br /&gt;
如果您发现打点后产生了对角线或者与其相同的平行线，这些区域具有一致性&lt;br /&gt;
&lt;br /&gt;
可用于寻找序列中的重复片段&lt;br /&gt;
&lt;br /&gt;
许多名字里带有Dot的软件可以用打点法比对序列如Dnadot，（dotlet似乎属于SIB&lt;br /&gt;
&lt;br /&gt;
=== 全局比对之Needleman-Swunch算法 ===&lt;br /&gt;
1970年由名字里的二人开发&lt;br /&gt;
&lt;br /&gt;
换一种方法理解打点法，您会发现她很像一种打分，只不过是0/1&lt;br /&gt;
[[文件:NStrue.png|缩略图|Needlemanswunch矩阵初始化]]&lt;br /&gt;
下面我们使用更加酷炫的动态规划（走格子），Needleman-Swunch的走格子步骤如下&lt;br /&gt;
&lt;br /&gt;
1，初始化矩阵，将两条序列用上一张图中的方法分别列出并且在开头处空一格，形成一个二维表格，在表格的左上角的边缘打上0，-1，-2，。。。一直到表格结束&lt;br /&gt;
&lt;br /&gt;
2&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E6%96%87%E4%BB%B6:NStrue.png&amp;diff=5053</id>
		<title>文件:NStrue.png</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E6%96%87%E4%BB%B6:NStrue.png&amp;diff=5053"/>
		<updated>2025-03-20T00:01:13Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;NS&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E6%AF%94%E5%AF%B9%E7%AE%97%E6%B3%95&amp;diff=5051</id>
		<title>比对算法</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E6%AF%94%E5%AF%B9%E7%AE%97%E6%B3%95&amp;diff=5051"/>
		<updated>2025-03-19T14:49:32Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​创建页面，内容为“介绍三种关于序列比对的算法，矩阵，进化树与更多  == 相似与一致与同源 ==  * 一致度：如果两个序列（蛋白质或核酸）长度相同，那么它们的一致度定义为对应位置上相同的残基（氨基酸或碱基）的数目占总长度的百分比。 * 相似度：如果两个序列长度相同，则相似度定义为它们对应位置上相似的残基与相同的残基的数目和占总长度的百分数。 * 同…”&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;介绍三种关于序列比对的算法，矩阵，进化树与更多&lt;br /&gt;
&lt;br /&gt;
== 相似与一致与同源 ==&lt;br /&gt;
&lt;br /&gt;
* 一致度：如果两个序列（蛋白质或核酸）长度相同，那么它们的一致度定义为对应位置上相同的残基（氨基酸或碱基）的数目占总长度的百分比。&lt;br /&gt;
* 相似度：如果两个序列长度相同，则相似度定义为它们对应位置上相似的残基与相同的残基的数目和占总长度的百分数。&lt;br /&gt;
* 同源性只能用有没有来形容，不能说“70%同源”这种胡话，类似于“这个布尔函数&amp;lt;ref&amp;gt;布尔函数是信息技术课上的一种数据存储形式&lt;br /&gt;
&lt;br /&gt;
只有0和正数两种值&amp;lt;/ref&amp;gt;有80%是0”&lt;br /&gt;
* 也就是说，一致度要求完全一样，相似度只要性质差不多也能算进去&lt;br /&gt;
&lt;br /&gt;
== 比对类型 ==&lt;br /&gt;
局部比对找出两个序列中高相似度的片段&lt;br /&gt;
&lt;br /&gt;
全局比对构建打分矩阵，打分。。。&lt;br /&gt;
&lt;br /&gt;
半局部比对对一条序列使用局部比对，另一条使用全局比对，如此求得最大匹配度&lt;br /&gt;
&lt;br /&gt;
== 比对矩阵 ==&lt;br /&gt;
如果希望对蛋白质或核酸序列进行比对，需要借助于矩阵（对于计分表的更高端叫法）打分，分高者相似&lt;br /&gt;
&lt;br /&gt;
=== 核酸矩阵 ===&lt;br /&gt;
&lt;br /&gt;
==== 等价矩阵 ====&lt;br /&gt;
将一致的计算为一分，不一致的计算为0分&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|+等价矩阵 &lt;br /&gt;
!&lt;br /&gt;
!A&lt;br /&gt;
!T&lt;br /&gt;
!C&lt;br /&gt;
!G&lt;br /&gt;
|-&lt;br /&gt;
!A&lt;br /&gt;
!1&lt;br /&gt;
!0&lt;br /&gt;
!0&lt;br /&gt;
!0&lt;br /&gt;
|-&lt;br /&gt;
|T&lt;br /&gt;
|0&lt;br /&gt;
|1&lt;br /&gt;
|0&lt;br /&gt;
|0&lt;br /&gt;
|-&lt;br /&gt;
|C&lt;br /&gt;
|0&lt;br /&gt;
|0&lt;br /&gt;
|1&lt;br /&gt;
|0&lt;br /&gt;
|-&lt;br /&gt;
|G&lt;br /&gt;
|0&lt;br /&gt;
|0&lt;br /&gt;
|0&lt;br /&gt;
|1&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
==== BLAST矩阵 ====&lt;br /&gt;
将一致的计算为+4分，不一致的计算为-5分&lt;br /&gt;
&lt;br /&gt;
和上一张差不多&lt;br /&gt;
&lt;br /&gt;
转换/颠换矩阵&amp;lt;ref&amp;gt;转换指的是嘌呤换嘌呤，嘧啶换嘧啶&lt;br /&gt;
&lt;br /&gt;
颠换指的是嘌呤换嘧啶(这么基础感觉没必要多嘴啊w)&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
将一致的计+1，转换计算-1，颠换计算-5&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|+&lt;br /&gt;
!&lt;br /&gt;
!A&lt;br /&gt;
!T&lt;br /&gt;
!C&lt;br /&gt;
!G&lt;br /&gt;
|-&lt;br /&gt;
!A&lt;br /&gt;
!1&lt;br /&gt;
!-5&lt;br /&gt;
!-5&lt;br /&gt;
!-1&lt;br /&gt;
|-&lt;br /&gt;
|T&lt;br /&gt;
| -5&lt;br /&gt;
|1&lt;br /&gt;
| -1&lt;br /&gt;
| -5&lt;br /&gt;
|-&lt;br /&gt;
|C&lt;br /&gt;
| -5&lt;br /&gt;
| -1&lt;br /&gt;
|1&lt;br /&gt;
| -5&lt;br /&gt;
|-&lt;br /&gt;
|G&lt;br /&gt;
| -1&lt;br /&gt;
| -5&lt;br /&gt;
| -5&lt;br /&gt;
|1&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质矩阵 ===&lt;br /&gt;
&lt;br /&gt;
==== PAM矩阵 ====&lt;br /&gt;
PAM矩阵是目前蛋白质序列比较中最广泛使用的记分方法之一，基础的PAM-1 矩阵反应的是进化产生的&#039;&#039;&#039;每一百个氨基酸平均发生一个突变的量值（统计方法得到）&#039;&#039;&#039;。&lt;br /&gt;
&lt;br /&gt;
PAM-1是由相似度大于85%的序列计算产生&lt;br /&gt;
&lt;br /&gt;
PAM-1 自乘n次，可以得到PAM-n，即发生了多次突变。也就是说PAM越大，相似度越小&lt;br /&gt;
&lt;br /&gt;
==== BLOSUM矩阵 ====&lt;br /&gt;
BLOSUM 矩阵都是通过对大量符合特定要求的序列计算而来。如BLOSUM62表示计算了相似度&amp;gt;62%的蛋白质序列得到结果&lt;br /&gt;
[[文件:屏幕截图(8).png|缩略图|比较PAM和BLOSUM]]&lt;br /&gt;
&lt;br /&gt;
==== GCM矩阵/遗传密码子矩阵 ====&lt;br /&gt;
两个氨基酸之间密码子所需的突变次数越多，替换代价越大（多用于进化树）&lt;br /&gt;
&lt;br /&gt;
==== 疏水矩阵 ====&lt;br /&gt;
疏水性相近的氨基酸得分更高&lt;br /&gt;
&lt;br /&gt;
== 比对序列 ==&lt;br /&gt;
&lt;br /&gt;
=== 动态规划 ===&lt;br /&gt;
核心原理是，如果你每一步都是最优解，那最后也一定是最优解&lt;br /&gt;
&lt;br /&gt;
也就是说，因为你在列表走格子的时候每次都取了最优解，所以比对结果也应该是最优解&lt;br /&gt;
&lt;br /&gt;
1950由理查德贝尔曼开发&lt;br /&gt;
&lt;br /&gt;
=== 打点法 ===&lt;br /&gt;
[[文件:序列比对笑传之compare cat brothers.png|缩略图|compare cat brothers]]&lt;br /&gt;
首先您需要找到两条序列THEFASTCAT和THEFATCAT&lt;br /&gt;
&lt;br /&gt;
将他们将两条序列用这一张图中的方法分别列出，形成一个二维表格，在字母相同（实际上是氨基酸相同）的位置打上点&lt;br /&gt;
&lt;br /&gt;
如果您发现打点后产生了对角线或者与其相同的平行线，这些区域具有一致性&lt;br /&gt;
&lt;br /&gt;
可用于寻找序列中的重复片段&lt;br /&gt;
&lt;br /&gt;
许多名字里带有Dot的软件可以用打点法比对序列如Dnadot，（dotlet似乎属于SIB&lt;br /&gt;
&lt;br /&gt;
=== 全局比对之Needleman-Swunch算法 ===&lt;br /&gt;
[[文件:NS.png|缩略图|初始化]]&lt;br /&gt;
1970年由名字里的二人开发&lt;br /&gt;
&lt;br /&gt;
换一种方法理解打点法，您会发现她很像一种打分，只不过是0/1&lt;br /&gt;
&lt;br /&gt;
下面我们使用更加酷炫的动态规划（走格子），Needleman-Swunch的走格子步骤如下&lt;br /&gt;
&lt;br /&gt;
1，初始化矩阵，将两条序列用上一张图中的方法分别列出并且在开头处空一格，形成一个二维表格&lt;br /&gt;
&lt;br /&gt;
2，tobecontinu&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E6%96%87%E4%BB%B6:NS.png&amp;diff=5050</id>
		<title>文件:NS.png</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E6%96%87%E4%BB%B6:NS.png&amp;diff=5050"/>
		<updated>2025-03-19T14:48:57Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;初始化NS表格&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E6%96%87%E4%BB%B6:%E5%BA%8F%E5%88%97%E6%AF%94%E5%AF%B9%E7%AC%91%E4%BC%A0%E4%B9%8Bcompare_cat_brothers.png&amp;diff=5049</id>
		<title>文件:序列比对笑传之compare cat brothers.png</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E6%96%87%E4%BB%B6:%E5%BA%8F%E5%88%97%E6%AF%94%E5%AF%B9%E7%AC%91%E4%BC%A0%E4%B9%8Bcompare_cat_brothers.png&amp;diff=5049"/>
		<updated>2025-03-19T14:37:25Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;纪念胖猫&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E6%96%87%E4%BB%B6:%E5%B1%8F%E5%B9%95%E6%88%AA%E5%9B%BE(8).png&amp;diff=5018</id>
		<title>文件:屏幕截图(8).png</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E6%96%87%E4%BB%B6:%E5%B1%8F%E5%B9%95%E6%88%AA%E5%9B%BE(8).png&amp;diff=5018"/>
		<updated>2025-03-19T09:38:20Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Blosum和pam的比较，照着外培看到的画&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=5014</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=5014"/>
		<updated>2025-03-19T08:15:28Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
国际核苷酸序列数据库协作 （INSDC），包含NLM-NCBI(美国）,ENA(欧洲,EMBL与EBI参与),DDBJ(日本),&lt;br /&gt;
&lt;br /&gt;
其创始成员是信息和系统研究组织、日本国家遗传学研究所 （ROIS-NIG）、欧洲分子生物学实验室 - 欧洲生物信息学研究所 （EMBL-EBI） 和美国国立卫生研究院的一个组成部分,国家医学图书馆-国家生物技术信息中心 （NLM-NCBI）。&lt;br /&gt;
&lt;br /&gt;
[https://geekdaxue.co/read/mugpeng@bioinfo/nmbmdk 有现成的]&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
PubMed诞生于1996年。最常用的文摘型数据库。其收录范围不仅包括Medline，还有大部分PMC和NIH基金资助作者的文献，NCBI书籍等。PubMed还提供链接到文献全文所在网站的全文链接。早期 PubMed 数据库主要的任务，是将 Mesh 目录(MEDlINE的早期目录，主题词表)中收录的医学主题与大量有关医学研究的文献相匹配。这意味着，PubMed最早的发布时间应该是在 1971 年，也就是 MEDLINE 数据库第一次正式发布的时间。&lt;br /&gt;
&lt;br /&gt;
MEDLINE始建于1966年（追溯收录至1946年），是NLM的期刊文献记录数据库。1983年，MEDLINE推出电子版，网上数据每日更新，光盘版每月更新。MEDLINE有严格的文献选择委员会LSTRC进行选刊。目前MEDLINE的文献都收录在PubMed中。&lt;br /&gt;
&lt;br /&gt;
PMC全称为PubMed Central，建立于2000年，由NCBI进行管理，是可以免费获取全文的生物医学和生命科学全文数据库，保存了NLM收录印刷杂志的电子副本。PMC的部分bookreview内容没有收录于PubMed。&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
Gempept NCBI关于肽段的数据库&lt;br /&gt;
&lt;br /&gt;
* the GenPept database is a collection of sequences based on translations from annotated coding regions in GenBank.GenPept 数据库是基于 GenBank 中带注释编码区的翻译的序列集合。&lt;br /&gt;
&lt;br /&gt;
Unigene&lt;br /&gt;
&lt;br /&gt;
UniGene最初是在缺乏参考基因组的情况下作为转录序列的基因导向分组，用于广泛的生物体。我们后来加入了基于基因组的分组。UniGene已被用作近似表达谱的来源，可用cDNA克隆的索引，并作为转录导向资源设计的指南。然而，随着短读测序技术的出现，每年提交给NCBI的est越来越少，并且具有相当规模的研究社区的大多数生物体都可以获得参考基因组。因此，UniGene的使用和需求显著下降。[https://ncbiinsights.ncbi.nlm.nih.gov/tag/unigene/ 于2019年7月关闭网页版，仍可以在NCBI找到数据库]&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签数据库，由NCBI维护&lt;br /&gt;
** ESTs是从不同生物体中提取的短序列片段，通常是基因的转录产物。这些ESTs是通过cDNA文库构建和测序获得的，可以提供有关特定基因的信息。ESTs的测序往往是高通量的，可以快速识别和记录大量的基因序列。&lt;br /&gt;
ORFfinder由NCBI开发，用于寻找原核生物ORF(ORF是可能的CDS)&lt;br /&gt;
&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
** psi-BLAST用位置特异权重矩阵搜索，适合远缘物种相似蛋白/家族新蛋白&lt;br /&gt;
** phi-BLAST模式发现迭代BLAST，仅输出序列中含有特殊模式的对齐&lt;br /&gt;
*** 精准度phiBLAST&amp;gt;BLASTp&amp;gt;psiBLAST,范围psiBLAST&amp;gt;BLASTp&amp;gt;phiBLAST&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== EMBL（European Molecular Biology Laboratory）欧洲分子生物学实验室 ==&lt;br /&gt;
总部位于德国海德堡，1974年由欧洲14个国家加上亚洲的以色列共同发起建立，现在由欧洲29个成员国政府支持组成，目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。&lt;br /&gt;
&lt;br /&gt;
[https://www.embl.org www.embl.org]&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成.2002 年，PIR 与其国际合作伙伴 EBI（欧洲生物信息学研究所）和 SIB（瑞士生物信息学研究所）一起获得了 NIH 的资助，创建了 UniProt。 通过统一 PIR-PSD、Swiss-Prot 和 TrEMBL 数据库，实现蛋白质序列和功能的单一全球数据库。&lt;br /&gt;
* Uniprot提供亚细胞定位，翻译后修饰&lt;br /&gt;
* Uniprot是包含蛋白质序列，功能信息，论文索引的蛋白质数据库，整合了包括EBI,SIB,PIR三大数据库的资源。&lt;br /&gt;
**EMBL-EBI是指欧洲生物信息学研究所（European Bioinformatics Institute），EMBL的一部分。1982年建立了先进的核苷酸序列数据库（EMBL-DNA），可进行核苷酸序列检索及序列相似性查询。TrEMBL&lt;br /&gt;
**SIB,瑞士生物信息学研究所，维护着ExPASy的服务器,Swissprot&lt;br /&gt;
*** &#039;&#039;&#039;ExPASy&#039;&#039;&#039;是一个集成了多种生物信息学工具和数据库的平台，专门用于蛋白质和蛋白质组学的研究。除了蛋白质相关的数据外，ExPASy还提供了其他生物信息学资源，如代谢通路数据库（KEGG京都代谢通路基因什么什么库）等。其中，Protparam工具是经常使用的功能，它可以根据蛋白质序列估计蛋白质的等电点（pi）、疏水性等特性。&lt;br /&gt;
**** [https://web.expasy.org/protscale/ Protscale]判断蛋白质序列的疏水性，返回的结果是疏水性曲线，亲水用负值表示,疏水用正值表示。原理是滑动窗口&lt;br /&gt;
**** Prosite数据库是一个用于存储和提供蛋白质序列和结构特征的资源。 主要功能是提供蛋白质的功能和结构信息可以识别功能域和模式，可用于蛋白质家族和亲缘关系的研究，预测蛋白质结构与功能&lt;br /&gt;
**** [https://web.expasy.org/protparam/ ProtParam]是一个工具，它允许计算存储在UniProtKB中的给定蛋白质或用户输入的蛋白质序列的&#039;&#039;&#039;各种物理和化学参数&#039;&#039;&#039;。计算参数包括分子量、理论pI、氨基酸组成、原子组成、消光系数、估计半衰期、不稳定性指数、脂肪族指数和亲水性大平均值。&lt;br /&gt;
****[http://www.pdg.cnb.uam.es/cursos/Leon_2003/pages/visualizacion/programas_manuales/spdbv_userguide/us.expasy.org/tools/aacomp/index.html AACompIdent]是一种工具，允许从其氨基酸组成鉴定蛋白质。它在Swiss-Prot和/或TrEMBL数据库中搜索氨基酸组成最接近给定氨基酸组成的蛋白质。&lt;br /&gt;
** PIR &#039;&#039;&#039;Protein information resource&#039;&#039;&#039;，由美国国家生物医学研究基金会（NBRF）于1984年成立,用于支持基因组学、蛋白质组学和系统生物学研究和科学研究。提供蛋白质数据库和分析工具，包括蛋白质序列数据库 （PSD）。PIR-PSD&lt;br /&gt;
*数据库的关系&lt;br /&gt;
通过INSDC等得到原始数据，处理后存入UniParc。&lt;br /&gt;
&lt;br /&gt;
UniParc作为数据仓库，再分别给UniProtKB，Proteomes，UniRef提供可靠的数据集。&lt;br /&gt;
这里的UniProtKB 由两个子库构成 Swiss-Prot，TrEMBL。&lt;br /&gt;
&lt;br /&gt;
Swiss-Prot 经过人工验证和注释，是高质量的蛋白质注释数据。但人工效率在高速增长的蛋白质数据面前显得极其低效。因此，注释这些数据需要大量时间，为了弥补这一问题。TrEMBL 被建立用于存储由机器自动翻译和预测的蛋白质序列。导致蛋白质数据冗余↑可信度↓。&lt;br /&gt;
&lt;br /&gt;
简而言之，在UniProtKB数据库中Swiss-Prot是由TrEMBL经过手动注释后得到的高质量非冗余数据库，也是我们今后常用的蛋白质数据库之一。&lt;br /&gt;
&lt;br /&gt;
[https://zhuanlan.zhihu.com/p/599641613 感谢知乎qwq]&lt;br /&gt;
&lt;br /&gt;
*Uniprot内部有UniPrac，Uniref，UniProtKB三层，由粗糙到精细列&lt;br /&gt;
** 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。UniParc由于数据冗余，将相同序列合并一条，唯一编号。&lt;br /&gt;
** 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
** 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&amp;lt;TrEMBL和Swissprot热血沸腾的组合技&amp;gt;&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&lt;br /&gt;
== 蛋白质结构数据库 ==&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质物理特性识别 ===&lt;br /&gt;
Compute pI/Mw&lt;br /&gt;
&lt;br /&gt;
* 计算蛋白质的 &#039;&#039;&#039;等电点（pI） 和 分子量（Mw）&#039;&#039;&#039;，基于氨基酸序列的电荷分布和组成。&lt;br /&gt;
* &#039;&#039;&#039;输入&#039;&#039;&#039;：蛋白质氨基酸序列（FASTA格式）。&#039;&#039;&#039;输出&#039;&#039;&#039;：pI和Mw的数值结果。&lt;br /&gt;
ExPasy的protogram数据库亦有记载&lt;br /&gt;
&lt;br /&gt;
=== 一级结构数据库 ===&lt;br /&gt;
PDB蛋白质结构数据库(Protein Data Bank)是美国Brookhaven国家实验室于1971年创建的，由结构生物信息学研究合作组织(RCSB)维护。&lt;br /&gt;
* PDB数据库以文本文件形式存储分子数据，每个分子形用一个独立的文件。早期的分子文件的文件名后缀为“.pdb”，1997年以后每1种生物大分子对应1组(3个)相关文件分别是：全文文件(后缀为“.full”相当于原来的“.pdb”文件)、书目文件(后缀为“.biblio”)和图形文件(后缀为“.gif”)。&lt;br /&gt;
* PDB数据库是生物大分子的原子坐标和描述蛋白质和其他重要生物大分子相关信息的存储库。结构生物学家使用x 射线晶体学、核磁共振光谱和冷冻电子显微镜等方法来确定分子中每个原子相对于彼此的位置，然后存储这些信息，并由PDB数据库注释并公开发布到档案中。&lt;br /&gt;
**[https://zhuanlan.zhihu.com/p/589697113/]&lt;br /&gt;
[https://www.rcsb.org/]&lt;br /&gt;
&lt;br /&gt;
=== 二级结构数据库 ===&lt;br /&gt;
DSSP工具：DSSP程序是一个二级结构分配（以及更多信息）的数据库，涵盖PDB中的所有蛋白质条目。DSSP也是从PDB条目计算DSSP条目的程序。DSSP并不预测二级结构。&lt;br /&gt;
&lt;br /&gt;
* 根据氢键模式和主链构象，将蛋白质的每个残基分类为特定的二级结构类型。算残基之间的氢键能量，用于确定二级结构的边界。计算每个残基的溶剂可及表面积（ASA），反映其在蛋白质表面的暴露程度。&lt;br /&gt;
* 输入：蛋白质的三维结构文件（通常为PDB格式）。输出：包含每个残基的二级结构类型、氢键信息、溶剂可及性等数据的文本文件。&lt;br /&gt;
&lt;br /&gt;
Pfam数据库重视&#039;&#039;&#039;蛋白质结构域和家族&#039;&#039;&#039;（基于序列同源性）分为Pfam-A和Pfam-B。。Pfam数据库主要用于蛋白质家族的分类和功能注释。&lt;br /&gt;
&lt;br /&gt;
* Pfam-A是手工整理的高质量家族集合，&lt;br /&gt;
* Pfam-B是自动生成的家族集合，具有更广泛但相对较低的准确性&lt;br /&gt;
&lt;br /&gt;
* 关注功能相关的蛋白质区域（如结构域），而非完整蛋白质的结构。&lt;br /&gt;
&lt;br /&gt;
* 分类依据：&lt;br /&gt;
** &#039;&#039;&#039;序列相似性&#039;&#039;&#039;，通过隐马尔可夫模型（HMM）比对识别保守区域。&lt;br /&gt;
** 基于多序列比对和进化关系。&lt;br /&gt;
&lt;br /&gt;
* 层次结构：&lt;br /&gt;
** 超家族（Clan）：多个家族在进化或功能上的关联。&lt;br /&gt;
** 家族（Family）：具有显著序列相似性的结构域集合&lt;br /&gt;
* Pfam的链接都已经重新定位到Interpro了,也是EMBL-EBI生的&lt;br /&gt;
&lt;br /&gt;
CATH数据库提供蛋白质三维结构与分类，关注&#039;&#039;&#039;结构的拓扑和进化起源&#039;&#039;&#039;。&lt;br /&gt;
&lt;br /&gt;
* 蛋白质三维结构的层次化分类（从二级结构到进化关系）以三维结构特征为依据，结合序列和功能信息进行分类&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构组成（如全α、全β、α+β、α/β）。&lt;br /&gt;
*# Architecture（架构）：描述二级结构的空间排布（如β桶、α螺旋束）。&lt;br /&gt;
*# Topology（拓扑）：基于折叠方式和连接性。&lt;br /&gt;
*# Homologous Superfamily&#039;&#039;&#039;（&#039;&#039;&#039;同源超家族）：进化相关的蛋白质。&lt;br /&gt;
&lt;br /&gt;
SCOP数据库分类强调进化同源性，基于结构与进化关系分类，由&#039;&#039;&#039;专家手动分类，强调超家族内的远缘同源关系。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构类型（如全α、全β等）。&lt;br /&gt;
*# Fold（折叠方式）：具有相似拓扑结构的蛋白质。&lt;br /&gt;
*# Superfamily（超家族）：推测具有共同祖先的结构相似蛋白质。&lt;br /&gt;
*# Family（家族）：明确序列同源性的蛋白质集合。&lt;br /&gt;
&lt;br /&gt;
* SCOPe引入自动化分类，但核心仍保留手动注释。&lt;br /&gt;
&amp;lt;这段deepseek写的，我对着笔记查了一下&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质三级结构预测 ===&lt;br /&gt;
* I-TASSER穿线法预测：有相似才能用从PDB中识别结构模板，并通过基于迭代模板的碎片组装模拟构建完整的原子模型(将蛋白质“穿入”已有的蛋白质结构模板)。 接着通过蛋白质功能数据库BioLiP对3D模型进行重新线程化，从而预测功能。&lt;br /&gt;
** 有人把ITASSER归进从头建模了&lt;br /&gt;
&lt;br /&gt;
* Swissmodel同源建模：按照FASTA格式输入氨基酸序列，要有相似度&amp;gt;30%的蛋白质模板&lt;br /&gt;
** 同源建模也称为比较建模，根据与已知结构的序列同源性预测蛋白质结构。基于“如果两个蛋白质具有足够高的序列相似性，它们很可能具有非常相似的三维结构”的原理。如果蛋白质序列之一具有已知结构，则可以以高置信度将该结构复制/映射到未知蛋白质。&lt;br /&gt;
** 质量评估：其中相似度值，即序列同源性经比对后结果在 40% 以上，则待预测蛋白与模板蛋白结构大概为同源蛋白，则同源建模方法可用于预测该蛋白三维结构。根据GMQE值及ＱＭEAN值评价结果，都是全局比对。&lt;br /&gt;
*** GMQE值在0－1之间，越接近１则建模质量越好&lt;br /&gt;
*** QMEAN值关于覆盖率区间为－４－０，越接近０则匹配度越好。&lt;br /&gt;
** 此功能在Modelle(蛋白质复合体同源建模)与Discovery Studio与AlphaFold-Multimer亦有记载&lt;br /&gt;
* QUARK从头计算：从头经历复杂的算法归纳到能量最低，此事在Alphafold亦有记载&lt;br /&gt;
* Rosetta综合以上算法，但亦有说同源建模的&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质功能与结构域数据库&amp;amp;预测 ===&lt;br /&gt;
&lt;br /&gt;
* InterPro是集成的蛋白质结构域和功能位点数据库，包含关于蛋白质家族、域、重复序列、和作用位点等数据资源。InterPro通过将蛋白质分类为家族并预测结构域和重要位点来提供蛋白质的功能分析。为了以这种方式对蛋白质进行分类，InterPro 使用由组成 InterPro 联盟的多个不同数据库（称为成员数据库）提供的预测模型（称为特征）。&lt;br /&gt;
** InterPro包含很多来自不同数据库的人工注释文件，形成了一个给定的蛋白质家族、结构域和功能位点的独特描述。&lt;br /&gt;
** Interpro数据库成员包括Coils 、Gene3D、Pfam、PRINTS、ProSitePatterns、ProSiteProfiles、SMART、SUPERFAMILY、 TIGRFAM、ProDom、PIR 数据库，每两个月更新一次&lt;br /&gt;
** EBI生的，可能假阳性&lt;br /&gt;
* Pfam数据库是一个庞大的蛋白质家族集合，每个家族都由多个序列比对和隐马尔可夫模型（HMMs）表示&lt;br /&gt;
* SMART 是一个用于蛋白质结构域鉴定、注释的在线分析工具。它的数据与UniProt、Ensembl和STRING数据库同步&lt;br /&gt;
** 您可以在两种不同的模式下使用 SMART：&#039;&#039;&#039;正常&#039;&#039;&#039;模式或&#039;&#039;&#039;基因组&#039;&#039;&#039;模式。主要区别在于所使用的基础蛋白质数据库。&lt;br /&gt;
** 在 &#039;&#039;&#039;Normal SMART&#039;&#039;&#039; 中，数据库包含 Swiss-Prot、SP-TrEMBL 和稳定的 Ensembl 蛋白质组。即使删除了相同的蛋白质，Normal SMART 中的蛋白质数据库具有显著的冗余性，&lt;br /&gt;
** 在 &#039;&#039;&#039;Genomic SMART&#039;&#039;&#039; 中，仅使用完全测序基因组的蛋白质组;后生动物的 Ensembl 和其余的 Swiss-Prot。如果您使用 SMART 来探索结构域架构，或者想要在各种基因组中查找确切的结构域计数，请考虑切换到&#039;&#039;&#039;基因组&#039;&#039;&#039;模式。结构域标注页中的数字会更准确，架构查询结果中不会有很多对应同一个基因的蛋白片段。&lt;br /&gt;
&lt;br /&gt;
=== 蛋白相互作用库 ===&lt;br /&gt;
&lt;br /&gt;
* DIP&amp;lt;sup&amp;gt;TM&amp;lt;/sup&amp;gt; 数据库对实验确定的蛋白质之间的相互作用进行了编目。它结合了来自各种来源的信息，以创建一组单一、一致的蛋白质-蛋白质相互作用。存储在 DIP 数据库中的数据既由专家策展人手动管理，也使用计算方法自动管理&lt;br /&gt;
* BioGRID(Biological General Repository for Interaction Datasets)数据库 生物相互作用网络，是由大量单个蛋白质或遗传相互作用以及RNA，DNA，膜，碳水化合物和小分子代谢物的相互作用聚集形成的，BioGRID致力于所有主要模式生物物种和人类的蛋白质，遗传和药物相互作用的管理和存[https://www.jianshu.com/p/63a5834c2fe9 储]&lt;br /&gt;
** 合并了DrugBank中的化学-蛋白质相互作用记录&lt;br /&gt;
** 为了协调和统一不同模式生物研究中使用的各种遗传相互作用术语，BioGRID与WormBase([https://wormbase.org/#012-34-5 线虫数据库])合作开发了新的标准化遗传相互作用结构术语或GIST。GIST已设计为使用通用遗传相互作用术语精确指定遗传相互作用&lt;br /&gt;
** BioGRID ORCS：用于CRISPR筛选数据的存储单元&lt;br /&gt;
* STRING功能性蛋白质关联网络。收集多个公共数据库，包括UniProt、KEGG、NCBI和Gene Ontology整合并生成一个全面的蛋白质相互作用网络数据库。&lt;br /&gt;
** 返回结果是网状的蛋白质互作消息&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质多序列比对 ===&lt;br /&gt;
多序列比对MSA是指把多条（3 条或以上）有系统进化关系的蛋白质分子的氨基酸序列或核酸序列进行比对，尽可能地把相同的碱基或氨基酸残基排在同一列上。对齐的碱基或氨基酸残基在进化上是同源的，即来自共同祖先。&lt;br /&gt;
&lt;br /&gt;
序列比对主要是为了寻找相似的序列，相似的序列往往起源于一个共同的祖先序列，它们很可能有相似的空间结构和生物学功能，有利于推测这个未知结构和功能的蛋白质的结构和功能。&lt;br /&gt;
&lt;br /&gt;
* Tcoffee核酸和蛋白质都可以&lt;br /&gt;
** 基本原理是首先构建一个包含有clustalw得到的序列两两比对和fasta得到的局部两两比对数据的库,并且给每个比对一个权重.然后把结果进行整合,最后是progressive比对过程.&lt;br /&gt;
** Rcoffee可以根据预测的RNA二级结构对比序列&lt;br /&gt;
* ClustralW有快慢两种模式，&lt;br /&gt;
** 原理是两两比对-&amp;gt;两两之间距离矩阵-&amp;gt;NJ建Binary进化树作为guidetree-&amp;gt;用progressive的方法添加序列到树上直到比对完成&lt;br /&gt;
** 有Accurate慢和Appropriate快两种模式，Accruate比Tcoffee快，Appropriate比Muscle慢&lt;br /&gt;
* Muscle&lt;br /&gt;
** 它之所以比clustalw快一方面是因为没有进行两两序列比对,用序列间共有的word数表征序列间的相似性;另一方面用UPGMA代替NJ构建guide tree. 如果没有对于结果的refinement过程,时间更短,时间复杂度为O(NL^2),也就是说时间和序列数成线性关系.&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质数据质量评估 ===&lt;br /&gt;
&lt;br /&gt;
* PROCHECK&lt;br /&gt;
** 在对蛋白的二级结构进行评估之时,一个重要的指标就是二面角φ, ψ是否在合理范围之内, 其中φ代表 α 碳原子和氮原子间的键的旋转度phi, ψ代表α碳原子和羰基碳原子间的键的旋转度。PROCHECK可以计算给定PDB文件的所有φ, ψ二面角, 然后给出总的评估结果,并将结果绘制成Ramachandran图表示。&lt;br /&gt;
** 不少于90%的二面角分布在图中的合理(蓝色)区域，则蛋白结构合理&lt;br /&gt;
* VERIFY_3D&lt;br /&gt;
** 对同源建模所得模型的质量进行了可视化分析，用来判断模型与氨基酸序列之间的兼容性。&lt;br /&gt;
** 对氨基酸残基数大于100的蛋白质，VERIFY_3D的评估结果更准确。&lt;br /&gt;
** 当不低于80%的氨基酸残基得分大 0.2时，即可认为目的蛋白建模所得模型属于高质量的模型结构。&lt;br /&gt;
* [https://proq.bioinfo.se/ProQ/ProQ.html ProQ - 蛋白质质量评价]&amp;lt;这个没找到总结&amp;gt; ProQ 是一种基于神经网络的预测器，它基于许多 结构特征可预测蛋白质模型的质量。ProQ 是 优化以找到正确的模型，与其他方法相比 经过优化以查找原生结构。两个质量衡量标准是 预测 LGscore 和 MaxSub。  LGscore 是 P 值的 -log，MaxSub 范围为 0-1，其中 0 为 微不足道和 1 个非常显著。&lt;br /&gt;
&lt;br /&gt;
=== 跨膜序列预测 ===&lt;br /&gt;
&lt;br /&gt;
* TMHMM由丹麦的CBS维护，使用隐马尔可夫模型预测跨膜蛋白序列&lt;br /&gt;
&lt;br /&gt;
* TMpred预测蛋白质的跨膜结构域（TMDs），基于氨基酸疏水性分析。输入蛋白质序列，输出跨膜区的位置、与拓扑结构（膜内/膜外方向）&lt;br /&gt;
&lt;br /&gt;
=== 信号肽SignalP ===&lt;br /&gt;
&lt;br /&gt;
* 预测蛋白质的 信号肽及其切割位点，判断是否为分泌蛋白或膜蛋白。&lt;br /&gt;
* &#039;&#039;&#039;输入&#039;&#039;&#039;：蛋白质序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：信号肽位置、切割位点概率、分泌类型（Sec/SPI/Tat）。&lt;br /&gt;
&lt;br /&gt;
=== 螺旋曲结构预测COILS ===&lt;br /&gt;
COILS 是一个程序，可将序列与已知平行双股盘绕线圈的数据库进行比较，并得出相似性分数。通过将此分数与球状和卷曲螺旋蛋白中的分数分布进行比较，该程序然后计算该序列将采用卷曲螺旋构象的概率。&lt;br /&gt;
&lt;br /&gt;
PSORT蛋白质亚细胞定位&amp;lt;ref&amp;gt;[https://zhuanlan.zhihu.com/p/426325112]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质修饰预测 ===&lt;br /&gt;
NMT蛋白质甲基化预测&lt;br /&gt;
&lt;br /&gt;
NetPho蛋白质磷酸化预测&lt;br /&gt;
&lt;br /&gt;
NetAcet蛋白质乙酰化&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== 搞人小数据库，考了之后就把名字全记下来了 ==&lt;br /&gt;
&lt;br /&gt;
=== 调控元件与内含子/外显子 ===&lt;br /&gt;
&lt;br /&gt;
* PLACE&#039;&#039;&#039;植物顺式作用元件数据库&#039;&#039;&#039;（Plant Cis-Acting Regulatory DNA Elements），存储植物启动子区域的功能性调控元件。&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：DNA序列（如启动子区域）。&#039;&#039;&#039;输出&#039;&#039;&#039;：匹配的调控元件名称、位置及功能注释。&lt;br /&gt;
* Augustus真核生物基因结构预测&lt;br /&gt;
** 基于隐马尔可夫模型（HMM）和物种特异性训练数据预测基因结构。&lt;br /&gt;
*** 可以直接预测训练之后的物种。若不存在被训练过的物种，需要[https://www.jianshu.com/p/6f7b2998600c 准备训练集和测试集进行训练]  可靠的基因结构序列的要求如下： 之后随机将注释数据集分成训练集和测试集，测试集要足够多的基因（100~200个），并且要足够的随机。  a. 提供基因的编码部分，包含上游几KB。通常，基因越多越好。还得保证有足够多的外显子，这样子才能训练内含子  b. 这些基因的基因结构一定足够准确。不过，也不需要百分百正确，只要保证起始密码子和终止密码子是准确的。  c. 需要保证这些基因没有冗余，不同序列如果有几乎相同的注释后氨基酸序列，那么仅仅取其中一个  d. 一条序列允许有多个基因，基因可以在正链也可以在负链，但是这些基因间不能有重叠，每个基因只要其中一个转录本，存放格式是GenBank&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：基因组DNA序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：预测的基因模型（外显子、内含子、CDS区域）、蛋白质序列。&lt;br /&gt;
* ORFfinder&lt;br /&gt;
** 识别DNA序列中的 开放阅读框ORF，基于遗传密码表扫描可能的编码区域。&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：DNA序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：ORF的位置、长度、翻译的氨基酸序列。&lt;br /&gt;
&lt;br /&gt;
=== 基因比对 ===&lt;br /&gt;
BWA-MEM自动选择全局/局部算法，长序列更适合&lt;br /&gt;
&lt;br /&gt;
SOAP快，短序列更加合适&lt;br /&gt;
&lt;br /&gt;
NovoAlign慢而准确&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=5013</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=5013"/>
		<updated>2025-03-19T08:14:02Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* 蛋白质物理特性识别 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
国际核苷酸序列数据库协作 （INSDC），包含NLM-NCBI(美国）,ENA(欧洲,EMBL与EBI参与),DDBJ(日本),&lt;br /&gt;
&lt;br /&gt;
其创始成员是信息和系统研究组织、日本国家遗传学研究所 （ROIS-NIG）、欧洲分子生物学实验室 - 欧洲生物信息学研究所 （EMBL-EBI） 和美国国立卫生研究院的一个组成部分,国家医学图书馆-国家生物技术信息中心 （NLM-NCBI）。&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
PubMed诞生于1996年。最常用的文摘型数据库。其收录范围不仅包括Medline，还有大部分PMC和NIH基金资助作者的文献，NCBI书籍等。PubMed还提供链接到文献全文所在网站的全文链接。早期 PubMed 数据库主要的任务，是将 Mesh 目录(MEDlINE的早期目录，主题词表)中收录的医学主题与大量有关医学研究的文献相匹配。这意味着，PubMed最早的发布时间应该是在 1971 年，也就是 MEDLINE 数据库第一次正式发布的时间。&lt;br /&gt;
&lt;br /&gt;
MEDLINE始建于1966年（追溯收录至1946年），是NLM的期刊文献记录数据库。1983年，MEDLINE推出电子版，网上数据每日更新，光盘版每月更新。MEDLINE有严格的文献选择委员会LSTRC进行选刊。目前MEDLINE的文献都收录在PubMed中。&lt;br /&gt;
&lt;br /&gt;
PMC全称为PubMed Central，建立于2000年，由NCBI进行管理，是可以免费获取全文的生物医学和生命科学全文数据库，保存了NLM收录印刷杂志的电子副本。PMC的部分bookreview内容没有收录于PubMed。&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
Gempept NCBI关于肽段的数据库&lt;br /&gt;
&lt;br /&gt;
* the GenPept database is a collection of sequences based on translations from annotated coding regions in GenBank.GenPept 数据库是基于 GenBank 中带注释编码区的翻译的序列集合。&lt;br /&gt;
&lt;br /&gt;
Unigene&lt;br /&gt;
&lt;br /&gt;
UniGene最初是在缺乏参考基因组的情况下作为转录序列的基因导向分组，用于广泛的生物体。我们后来加入了基于基因组的分组。UniGene已被用作近似表达谱的来源，可用cDNA克隆的索引，并作为转录导向资源设计的指南。然而，随着短读测序技术的出现，每年提交给NCBI的est越来越少，并且具有相当规模的研究社区的大多数生物体都可以获得参考基因组。因此，UniGene的使用和需求显著下降。[https://ncbiinsights.ncbi.nlm.nih.gov/tag/unigene/ 于2019年7月关闭网页版，仍可以在NCBI找到数据库]&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签数据库，由NCBI维护&lt;br /&gt;
** ESTs是从不同生物体中提取的短序列片段，通常是基因的转录产物。这些ESTs是通过cDNA文库构建和测序获得的，可以提供有关特定基因的信息。ESTs的测序往往是高通量的，可以快速识别和记录大量的基因序列。&lt;br /&gt;
ORFfinder由NCBI开发，用于寻找原核生物ORF(ORF是可能的CDS)&lt;br /&gt;
&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
** psi-BLAST用位置特异权重矩阵搜索，适合远缘物种相似蛋白/家族新蛋白&lt;br /&gt;
** phi-BLAST模式发现迭代BLAST，仅输出序列中含有特殊模式的对齐&lt;br /&gt;
*** 精准度phiBLAST&amp;gt;BLASTp&amp;gt;psiBLAST,范围psiBLAST&amp;gt;BLASTp&amp;gt;phiBLAST&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== EMBL（European Molecular Biology Laboratory）欧洲分子生物学实验室 ==&lt;br /&gt;
总部位于德国海德堡，1974年由欧洲14个国家加上亚洲的以色列共同发起建立，现在由欧洲29个成员国政府支持组成，目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。&lt;br /&gt;
&lt;br /&gt;
[https://www.embl.org www.embl.org]&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成.2002 年，PIR 与其国际合作伙伴 EBI（欧洲生物信息学研究所）和 SIB（瑞士生物信息学研究所）一起获得了 NIH 的资助，创建了 UniProt。 通过统一 PIR-PSD、Swiss-Prot 和 TrEMBL 数据库，实现蛋白质序列和功能的单一全球数据库。&lt;br /&gt;
* Uniprot提供亚细胞定位，翻译后修饰&lt;br /&gt;
* Uniprot是包含蛋白质序列，功能信息，论文索引的蛋白质数据库，整合了包括EBI,SIB,PIR三大数据库的资源。&lt;br /&gt;
**EMBL-EBI是指欧洲生物信息学研究所（European Bioinformatics Institute），EMBL的一部分。1982年建立了先进的核苷酸序列数据库（EMBL-DNA），可进行核苷酸序列检索及序列相似性查询。TrEMBL&lt;br /&gt;
**SIB,瑞士生物信息学研究所，维护着ExPASy的服务器,Swissprot&lt;br /&gt;
*** &#039;&#039;&#039;ExPASy&#039;&#039;&#039;是一个集成了多种生物信息学工具和数据库的平台，专门用于蛋白质和蛋白质组学的研究。除了蛋白质相关的数据外，ExPASy还提供了其他生物信息学资源，如代谢通路数据库（KEGG京都代谢通路基因什么什么库）等。其中，Protparam工具是经常使用的功能，它可以根据蛋白质序列估计蛋白质的等电点（pi）、疏水性等特性。&lt;br /&gt;
**** [https://web.expasy.org/protscale/ Protscale]判断蛋白质序列的疏水性，返回的结果是疏水性曲线，亲水用负值表示,疏水用正值表示。原理是滑动窗口&lt;br /&gt;
**** Prosite数据库是一个用于存储和提供蛋白质序列和结构特征的资源。 主要功能是提供蛋白质的功能和结构信息可以识别功能域和模式，可用于蛋白质家族和亲缘关系的研究，预测蛋白质结构与功能&lt;br /&gt;
**** [https://web.expasy.org/protparam/ ProtParam]是一个工具，它允许计算存储在UniProtKB中的给定蛋白质或用户输入的蛋白质序列的&#039;&#039;&#039;各种物理和化学参数&#039;&#039;&#039;。计算参数包括分子量、理论pI、氨基酸组成、原子组成、消光系数、估计半衰期、不稳定性指数、脂肪族指数和亲水性大平均值。&lt;br /&gt;
****[http://www.pdg.cnb.uam.es/cursos/Leon_2003/pages/visualizacion/programas_manuales/spdbv_userguide/us.expasy.org/tools/aacomp/index.html AACompIdent]是一种工具，允许从其氨基酸组成鉴定蛋白质。它在Swiss-Prot和/或TrEMBL数据库中搜索氨基酸组成最接近给定氨基酸组成的蛋白质。&lt;br /&gt;
** PIR &#039;&#039;&#039;Protein information resource&#039;&#039;&#039;，由美国国家生物医学研究基金会（NBRF）于1984年成立,用于支持基因组学、蛋白质组学和系统生物学研究和科学研究。提供蛋白质数据库和分析工具，包括蛋白质序列数据库 （PSD）。PIR-PSD&lt;br /&gt;
*数据库的关系&lt;br /&gt;
通过INSDC等得到原始数据，处理后存入UniParc。&lt;br /&gt;
&lt;br /&gt;
UniParc作为数据仓库，再分别给UniProtKB，Proteomes，UniRef提供可靠的数据集。&lt;br /&gt;
这里的UniProtKB 由两个子库构成 Swiss-Prot，TrEMBL。&lt;br /&gt;
&lt;br /&gt;
Swiss-Prot 经过人工验证和注释，是高质量的蛋白质注释数据。但人工效率在高速增长的蛋白质数据面前显得极其低效。因此，注释这些数据需要大量时间，为了弥补这一问题。TrEMBL 被建立用于存储由机器自动翻译和预测的蛋白质序列。导致蛋白质数据冗余↑可信度↓。&lt;br /&gt;
&lt;br /&gt;
简而言之，在UniProtKB数据库中Swiss-Prot是由TrEMBL经过手动注释后得到的高质量非冗余数据库，也是我们今后常用的蛋白质数据库之一。&lt;br /&gt;
&lt;br /&gt;
[https://zhuanlan.zhihu.com/p/599641613 感谢知乎qwq]&lt;br /&gt;
&lt;br /&gt;
*Uniprot内部有UniPrac，Uniref，UniProtKB三层，由粗糙到精细列&lt;br /&gt;
** 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。UniParc由于数据冗余，将相同序列合并一条，唯一编号。&lt;br /&gt;
** 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
** 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&amp;lt;TrEMBL和Swissprot热血沸腾的组合技&amp;gt;&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&lt;br /&gt;
== 蛋白质结构数据库 ==&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质物理特性识别 ===&lt;br /&gt;
Compute pI/Mw&lt;br /&gt;
&lt;br /&gt;
* 计算蛋白质的 &#039;&#039;&#039;等电点（pI） 和 分子量（Mw）&#039;&#039;&#039;，基于氨基酸序列的电荷分布和组成。&lt;br /&gt;
* &#039;&#039;&#039;输入&#039;&#039;&#039;：蛋白质氨基酸序列（FASTA格式）。&#039;&#039;&#039;输出&#039;&#039;&#039;：pI和Mw的数值结果。&lt;br /&gt;
ExPasy的protogram数据库亦有记载&lt;br /&gt;
&lt;br /&gt;
=== 一级结构数据库 ===&lt;br /&gt;
PDB蛋白质结构数据库(Protein Data Bank)是美国Brookhaven国家实验室于1971年创建的，由结构生物信息学研究合作组织(RCSB)维护。&lt;br /&gt;
* PDB数据库以文本文件形式存储分子数据，每个分子形用一个独立的文件。早期的分子文件的文件名后缀为“.pdb”，1997年以后每1种生物大分子对应1组(3个)相关文件分别是：全文文件(后缀为“.full”相当于原来的“.pdb”文件)、书目文件(后缀为“.biblio”)和图形文件(后缀为“.gif”)。&lt;br /&gt;
* PDB数据库是生物大分子的原子坐标和描述蛋白质和其他重要生物大分子相关信息的存储库。结构生物学家使用x 射线晶体学、核磁共振光谱和冷冻电子显微镜等方法来确定分子中每个原子相对于彼此的位置，然后存储这些信息，并由PDB数据库注释并公开发布到档案中。&lt;br /&gt;
**[https://zhuanlan.zhihu.com/p/589697113/]&lt;br /&gt;
[https://www.rcsb.org/]&lt;br /&gt;
&lt;br /&gt;
=== 二级结构数据库 ===&lt;br /&gt;
DSSP工具：DSSP程序是一个二级结构分配（以及更多信息）的数据库，涵盖PDB中的所有蛋白质条目。DSSP也是从PDB条目计算DSSP条目的程序。DSSP并不预测二级结构。&lt;br /&gt;
&lt;br /&gt;
* 根据氢键模式和主链构象，将蛋白质的每个残基分类为特定的二级结构类型。算残基之间的氢键能量，用于确定二级结构的边界。计算每个残基的溶剂可及表面积（ASA），反映其在蛋白质表面的暴露程度。&lt;br /&gt;
* 输入：蛋白质的三维结构文件（通常为PDB格式）。输出：包含每个残基的二级结构类型、氢键信息、溶剂可及性等数据的文本文件。&lt;br /&gt;
&lt;br /&gt;
Pfam数据库重视&#039;&#039;&#039;蛋白质结构域和家族&#039;&#039;&#039;（基于序列同源性）分为Pfam-A和Pfam-B。。Pfam数据库主要用于蛋白质家族的分类和功能注释。&lt;br /&gt;
&lt;br /&gt;
* Pfam-A是手工整理的高质量家族集合，&lt;br /&gt;
* Pfam-B是自动生成的家族集合，具有更广泛但相对较低的准确性&lt;br /&gt;
&lt;br /&gt;
* 关注功能相关的蛋白质区域（如结构域），而非完整蛋白质的结构。&lt;br /&gt;
&lt;br /&gt;
* 分类依据：&lt;br /&gt;
** &#039;&#039;&#039;序列相似性&#039;&#039;&#039;，通过隐马尔可夫模型（HMM）比对识别保守区域。&lt;br /&gt;
** 基于多序列比对和进化关系。&lt;br /&gt;
&lt;br /&gt;
* 层次结构：&lt;br /&gt;
** 超家族（Clan）：多个家族在进化或功能上的关联。&lt;br /&gt;
** 家族（Family）：具有显著序列相似性的结构域集合&lt;br /&gt;
* Pfam的链接都已经重新定位到Interpro了,也是EMBL-EBI生的&lt;br /&gt;
&lt;br /&gt;
CATH数据库提供蛋白质三维结构与分类，关注&#039;&#039;&#039;结构的拓扑和进化起源&#039;&#039;&#039;。&lt;br /&gt;
&lt;br /&gt;
* 蛋白质三维结构的层次化分类（从二级结构到进化关系）以三维结构特征为依据，结合序列和功能信息进行分类&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构组成（如全α、全β、α+β、α/β）。&lt;br /&gt;
*# Architecture（架构）：描述二级结构的空间排布（如β桶、α螺旋束）。&lt;br /&gt;
*# Topology（拓扑）：基于折叠方式和连接性。&lt;br /&gt;
*# Homologous Superfamily&#039;&#039;&#039;（&#039;&#039;&#039;同源超家族）：进化相关的蛋白质。&lt;br /&gt;
&lt;br /&gt;
SCOP数据库分类强调进化同源性，基于结构与进化关系分类，由&#039;&#039;&#039;专家手动分类，强调超家族内的远缘同源关系。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构类型（如全α、全β等）。&lt;br /&gt;
*# Fold（折叠方式）：具有相似拓扑结构的蛋白质。&lt;br /&gt;
*# Superfamily（超家族）：推测具有共同祖先的结构相似蛋白质。&lt;br /&gt;
*# Family（家族）：明确序列同源性的蛋白质集合。&lt;br /&gt;
&lt;br /&gt;
* SCOPe引入自动化分类，但核心仍保留手动注释。&lt;br /&gt;
&amp;lt;这段deepseek写的，我对着笔记查了一下&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质三级结构预测 ===&lt;br /&gt;
* I-TASSER穿线法预测：有相似才能用从PDB中识别结构模板，并通过基于迭代模板的碎片组装模拟构建完整的原子模型(将蛋白质“穿入”已有的蛋白质结构模板)。 接着通过蛋白质功能数据库BioLiP对3D模型进行重新线程化，从而预测功能。&lt;br /&gt;
** 有人把ITASSER归进从头建模了&lt;br /&gt;
&lt;br /&gt;
* Swissmodel同源建模：按照FASTA格式输入氨基酸序列，要有相似度&amp;gt;30%的蛋白质模板&lt;br /&gt;
** 同源建模也称为比较建模，根据与已知结构的序列同源性预测蛋白质结构。基于“如果两个蛋白质具有足够高的序列相似性，它们很可能具有非常相似的三维结构”的原理。如果蛋白质序列之一具有已知结构，则可以以高置信度将该结构复制/映射到未知蛋白质。&lt;br /&gt;
** 质量评估：其中相似度值，即序列同源性经比对后结果在 40% 以上，则待预测蛋白与模板蛋白结构大概为同源蛋白，则同源建模方法可用于预测该蛋白三维结构。根据GMQE值及ＱＭEAN值评价结果，都是全局比对。&lt;br /&gt;
*** GMQE值在0－1之间，越接近１则建模质量越好&lt;br /&gt;
*** QMEAN值关于覆盖率区间为－４－０，越接近０则匹配度越好。&lt;br /&gt;
** 此功能在Modelle(蛋白质复合体同源建模)与Discovery Studio与AlphaFold-Multimer亦有记载&lt;br /&gt;
* QUARK从头计算：从头经历复杂的算法归纳到能量最低，此事在Alphafold亦有记载&lt;br /&gt;
* Rosetta综合以上算法，但亦有说同源建模的&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质功能与结构域数据库&amp;amp;预测 ===&lt;br /&gt;
&lt;br /&gt;
* InterPro是集成的蛋白质结构域和功能位点数据库，包含关于蛋白质家族、域、重复序列、和作用位点等数据资源。InterPro通过将蛋白质分类为家族并预测结构域和重要位点来提供蛋白质的功能分析。为了以这种方式对蛋白质进行分类，InterPro 使用由组成 InterPro 联盟的多个不同数据库（称为成员数据库）提供的预测模型（称为特征）。&lt;br /&gt;
** InterPro包含很多来自不同数据库的人工注释文件，形成了一个给定的蛋白质家族、结构域和功能位点的独特描述。&lt;br /&gt;
** Interpro数据库成员包括Coils 、Gene3D、Pfam、PRINTS、ProSitePatterns、ProSiteProfiles、SMART、SUPERFAMILY、 TIGRFAM、ProDom、PIR 数据库，每两个月更新一次&lt;br /&gt;
** EBI生的，可能假阳性&lt;br /&gt;
* Pfam数据库是一个庞大的蛋白质家族集合，每个家族都由多个序列比对和隐马尔可夫模型（HMMs）表示&lt;br /&gt;
* SMART 是一个用于蛋白质结构域鉴定、注释的在线分析工具。它的数据与UniProt、Ensembl和STRING数据库同步&lt;br /&gt;
** 您可以在两种不同的模式下使用 SMART：&#039;&#039;&#039;正常&#039;&#039;&#039;模式或&#039;&#039;&#039;基因组&#039;&#039;&#039;模式。主要区别在于所使用的基础蛋白质数据库。&lt;br /&gt;
** 在 &#039;&#039;&#039;Normal SMART&#039;&#039;&#039; 中，数据库包含 Swiss-Prot、SP-TrEMBL 和稳定的 Ensembl 蛋白质组。即使删除了相同的蛋白质，Normal SMART 中的蛋白质数据库具有显著的冗余性，&lt;br /&gt;
** 在 &#039;&#039;&#039;Genomic SMART&#039;&#039;&#039; 中，仅使用完全测序基因组的蛋白质组;后生动物的 Ensembl 和其余的 Swiss-Prot。如果您使用 SMART 来探索结构域架构，或者想要在各种基因组中查找确切的结构域计数，请考虑切换到&#039;&#039;&#039;基因组&#039;&#039;&#039;模式。结构域标注页中的数字会更准确，架构查询结果中不会有很多对应同一个基因的蛋白片段。&lt;br /&gt;
&lt;br /&gt;
=== 蛋白相互作用库 ===&lt;br /&gt;
&lt;br /&gt;
* DIP&amp;lt;sup&amp;gt;TM&amp;lt;/sup&amp;gt; 数据库对实验确定的蛋白质之间的相互作用进行了编目。它结合了来自各种来源的信息，以创建一组单一、一致的蛋白质-蛋白质相互作用。存储在 DIP 数据库中的数据既由专家策展人手动管理，也使用计算方法自动管理&lt;br /&gt;
* BioGRID(Biological General Repository for Interaction Datasets)数据库 生物相互作用网络，是由大量单个蛋白质或遗传相互作用以及RNA，DNA，膜，碳水化合物和小分子代谢物的相互作用聚集形成的，BioGRID致力于所有主要模式生物物种和人类的蛋白质，遗传和药物相互作用的管理和存[https://www.jianshu.com/p/63a5834c2fe9 储]&lt;br /&gt;
** 合并了DrugBank中的化学-蛋白质相互作用记录&lt;br /&gt;
** 为了协调和统一不同模式生物研究中使用的各种遗传相互作用术语，BioGRID与WormBase([https://wormbase.org/#012-34-5 线虫数据库])合作开发了新的标准化遗传相互作用结构术语或GIST。GIST已设计为使用通用遗传相互作用术语精确指定遗传相互作用&lt;br /&gt;
** BioGRID ORCS：用于CRISPR筛选数据的存储单元&lt;br /&gt;
* STRING功能性蛋白质关联网络。收集多个公共数据库，包括UniProt、KEGG、NCBI和Gene Ontology整合并生成一个全面的蛋白质相互作用网络数据库。&lt;br /&gt;
** 返回结果是网状的蛋白质互作消息&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质多序列比对 ===&lt;br /&gt;
多序列比对MSA是指把多条（3 条或以上）有系统进化关系的蛋白质分子的氨基酸序列或核酸序列进行比对，尽可能地把相同的碱基或氨基酸残基排在同一列上。对齐的碱基或氨基酸残基在进化上是同源的，即来自共同祖先。&lt;br /&gt;
&lt;br /&gt;
序列比对主要是为了寻找相似的序列，相似的序列往往起源于一个共同的祖先序列，它们很可能有相似的空间结构和生物学功能，有利于推测这个未知结构和功能的蛋白质的结构和功能。&lt;br /&gt;
&lt;br /&gt;
* Tcoffee核酸和蛋白质都可以&lt;br /&gt;
** 基本原理是首先构建一个包含有clustalw得到的序列两两比对和fasta得到的局部两两比对数据的库,并且给每个比对一个权重.然后把结果进行整合,最后是progressive比对过程.&lt;br /&gt;
** Rcoffee可以根据预测的RNA二级结构对比序列&lt;br /&gt;
* ClustralW有快慢两种模式，&lt;br /&gt;
** 原理是两两比对-&amp;gt;两两之间距离矩阵-&amp;gt;NJ建Binary进化树作为guidetree-&amp;gt;用progressive的方法添加序列到树上直到比对完成&lt;br /&gt;
** 有Accurate慢和Appropriate快两种模式，Accruate比Tcoffee快，Appropriate比Muscle慢&lt;br /&gt;
* Muscle&lt;br /&gt;
** 它之所以比clustalw快一方面是因为没有进行两两序列比对,用序列间共有的word数表征序列间的相似性;另一方面用UPGMA代替NJ构建guide tree. 如果没有对于结果的refinement过程,时间更短,时间复杂度为O(NL^2),也就是说时间和序列数成线性关系.&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质数据质量评估 ===&lt;br /&gt;
&lt;br /&gt;
* PROCHECK&lt;br /&gt;
** 在对蛋白的二级结构进行评估之时,一个重要的指标就是二面角φ, ψ是否在合理范围之内, 其中φ代表 α 碳原子和氮原子间的键的旋转度phi, ψ代表α碳原子和羰基碳原子间的键的旋转度。PROCHECK可以计算给定PDB文件的所有φ, ψ二面角, 然后给出总的评估结果,并将结果绘制成Ramachandran图表示。&lt;br /&gt;
** 不少于90%的二面角分布在图中的合理(蓝色)区域，则蛋白结构合理&lt;br /&gt;
* VERIFY_3D&lt;br /&gt;
** 对同源建模所得模型的质量进行了可视化分析，用来判断模型与氨基酸序列之间的兼容性。&lt;br /&gt;
** 对氨基酸残基数大于100的蛋白质，VERIFY_3D的评估结果更准确。&lt;br /&gt;
** 当不低于80%的氨基酸残基得分大 0.2时，即可认为目的蛋白建模所得模型属于高质量的模型结构。&lt;br /&gt;
* [https://proq.bioinfo.se/ProQ/ProQ.html ProQ - 蛋白质质量评价]&amp;lt;这个没找到总结&amp;gt; ProQ 是一种基于神经网络的预测器，它基于许多 结构特征可预测蛋白质模型的质量。ProQ 是 优化以找到正确的模型，与其他方法相比 经过优化以查找原生结构。两个质量衡量标准是 预测 LGscore 和 MaxSub。  LGscore 是 P 值的 -log，MaxSub 范围为 0-1，其中 0 为 微不足道和 1 个非常显著。&lt;br /&gt;
&lt;br /&gt;
=== 跨膜序列预测 ===&lt;br /&gt;
&lt;br /&gt;
* TMHMM由丹麦的CBS维护，使用隐马尔可夫模型预测跨膜蛋白序列&lt;br /&gt;
&lt;br /&gt;
* TMpred预测蛋白质的跨膜结构域（TMDs），基于氨基酸疏水性分析。输入蛋白质序列，输出跨膜区的位置、与拓扑结构（膜内/膜外方向）&lt;br /&gt;
&lt;br /&gt;
=== 信号肽SignalP ===&lt;br /&gt;
&lt;br /&gt;
* 预测蛋白质的 信号肽及其切割位点，判断是否为分泌蛋白或膜蛋白。&lt;br /&gt;
* &#039;&#039;&#039;输入&#039;&#039;&#039;：蛋白质序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：信号肽位置、切割位点概率、分泌类型（Sec/SPI/Tat）。&lt;br /&gt;
&lt;br /&gt;
=== 螺旋曲结构预测COILS ===&lt;br /&gt;
COILS 是一个程序，可将序列与已知平行双股盘绕线圈的数据库进行比较，并得出相似性分数。通过将此分数与球状和卷曲螺旋蛋白中的分数分布进行比较，该程序然后计算该序列将采用卷曲螺旋构象的概率。&lt;br /&gt;
&lt;br /&gt;
PSORT蛋白质亚细胞定位&amp;lt;ref&amp;gt;[https://zhuanlan.zhihu.com/p/426325112]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质修饰预测 ===&lt;br /&gt;
NMT蛋白质甲基化预测&lt;br /&gt;
&lt;br /&gt;
NetPho蛋白质磷酸化预测&lt;br /&gt;
&lt;br /&gt;
NetAcet蛋白质乙酰化&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== 搞人小数据库，考了之后就把名字全记下来了 ==&lt;br /&gt;
&lt;br /&gt;
=== 调控元件与内含子/外显子 ===&lt;br /&gt;
&lt;br /&gt;
* PLACE&#039;&#039;&#039;植物顺式作用元件数据库&#039;&#039;&#039;（Plant Cis-Acting Regulatory DNA Elements），存储植物启动子区域的功能性调控元件。&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：DNA序列（如启动子区域）。&#039;&#039;&#039;输出&#039;&#039;&#039;：匹配的调控元件名称、位置及功能注释。&lt;br /&gt;
* Augustus真核生物基因结构预测&lt;br /&gt;
** 基于隐马尔可夫模型（HMM）和物种特异性训练数据预测基因结构。&lt;br /&gt;
*** 可以直接预测训练之后的物种。若不存在被训练过的物种，需要[https://www.jianshu.com/p/6f7b2998600c 准备训练集和测试集进行训练]  可靠的基因结构序列的要求如下： 之后随机将注释数据集分成训练集和测试集，测试集要足够多的基因（100~200个），并且要足够的随机。  a. 提供基因的编码部分，包含上游几KB。通常，基因越多越好。还得保证有足够多的外显子，这样子才能训练内含子  b. 这些基因的基因结构一定足够准确。不过，也不需要百分百正确，只要保证起始密码子和终止密码子是准确的。  c. 需要保证这些基因没有冗余，不同序列如果有几乎相同的注释后氨基酸序列，那么仅仅取其中一个  d. 一条序列允许有多个基因，基因可以在正链也可以在负链，但是这些基因间不能有重叠，每个基因只要其中一个转录本，存放格式是GenBank&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：基因组DNA序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：预测的基因模型（外显子、内含子、CDS区域）、蛋白质序列。&lt;br /&gt;
* ORFfinder&lt;br /&gt;
** 识别DNA序列中的 开放阅读框ORF，基于遗传密码表扫描可能的编码区域。&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：DNA序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：ORF的位置、长度、翻译的氨基酸序列。&lt;br /&gt;
&lt;br /&gt;
=== 基因比对 ===&lt;br /&gt;
BWA-MEM自动选择全局/局部算法，长序列更适合&lt;br /&gt;
&lt;br /&gt;
SOAP快，短序列更加合适&lt;br /&gt;
&lt;br /&gt;
NovoAlign慢而准确&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=5011</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=5011"/>
		<updated>2025-03-19T07:58:29Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心） */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
国际核苷酸序列数据库协作 （INSDC），包含NLM-NCBI(美国）,ENA(欧洲,EMBL与EBI参与),DDBJ(日本),&lt;br /&gt;
&lt;br /&gt;
其创始成员是信息和系统研究组织、日本国家遗传学研究所 （ROIS-NIG）、欧洲分子生物学实验室 - 欧洲生物信息学研究所 （EMBL-EBI） 和美国国立卫生研究院的一个组成部分,国家医学图书馆-国家生物技术信息中心 （NLM-NCBI）。&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
PubMed诞生于1996年。最常用的文摘型数据库。其收录范围不仅包括Medline，还有大部分PMC和NIH基金资助作者的文献，NCBI书籍等。PubMed还提供链接到文献全文所在网站的全文链接。早期 PubMed 数据库主要的任务，是将 Mesh 目录(MEDlINE的早期目录，主题词表)中收录的医学主题与大量有关医学研究的文献相匹配。这意味着，PubMed最早的发布时间应该是在 1971 年，也就是 MEDLINE 数据库第一次正式发布的时间。&lt;br /&gt;
&lt;br /&gt;
MEDLINE始建于1966年（追溯收录至1946年），是NLM的期刊文献记录数据库。1983年，MEDLINE推出电子版，网上数据每日更新，光盘版每月更新。MEDLINE有严格的文献选择委员会LSTRC进行选刊。目前MEDLINE的文献都收录在PubMed中。&lt;br /&gt;
&lt;br /&gt;
PMC全称为PubMed Central，建立于2000年，由NCBI进行管理，是可以免费获取全文的生物医学和生命科学全文数据库，保存了NLM收录印刷杂志的电子副本。PMC的部分bookreview内容没有收录于PubMed。&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
Gempept NCBI关于肽段的数据库&lt;br /&gt;
&lt;br /&gt;
* the GenPept database is a collection of sequences based on translations from annotated coding regions in GenBank.GenPept 数据库是基于 GenBank 中带注释编码区的翻译的序列集合。&lt;br /&gt;
&lt;br /&gt;
Unigene&lt;br /&gt;
&lt;br /&gt;
UniGene最初是在缺乏参考基因组的情况下作为转录序列的基因导向分组，用于广泛的生物体。我们后来加入了基于基因组的分组。UniGene已被用作近似表达谱的来源，可用cDNA克隆的索引，并作为转录导向资源设计的指南。然而，随着短读测序技术的出现，每年提交给NCBI的est越来越少，并且具有相当规模的研究社区的大多数生物体都可以获得参考基因组。因此，UniGene的使用和需求显著下降。[https://ncbiinsights.ncbi.nlm.nih.gov/tag/unigene/ 于2019年7月关闭网页版，仍可以在NCBI找到数据库]&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签数据库，由NCBI维护&lt;br /&gt;
** ESTs是从不同生物体中提取的短序列片段，通常是基因的转录产物。这些ESTs是通过cDNA文库构建和测序获得的，可以提供有关特定基因的信息。ESTs的测序往往是高通量的，可以快速识别和记录大量的基因序列。&lt;br /&gt;
ORFfinder由NCBI开发，用于寻找原核生物ORF(ORF是可能的CDS)&lt;br /&gt;
&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
** psi-BLAST用位置特异权重矩阵搜索，适合远缘物种相似蛋白/家族新蛋白&lt;br /&gt;
** phi-BLAST模式发现迭代BLAST，仅输出序列中含有特殊模式的对齐&lt;br /&gt;
*** 精准度phiBLAST&amp;gt;BLASTp&amp;gt;psiBLAST,范围psiBLAST&amp;gt;BLASTp&amp;gt;phiBLAST&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== EMBL（European Molecular Biology Laboratory）欧洲分子生物学实验室 ==&lt;br /&gt;
总部位于德国海德堡，1974年由欧洲14个国家加上亚洲的以色列共同发起建立，现在由欧洲29个成员国政府支持组成，目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。&lt;br /&gt;
&lt;br /&gt;
[https://www.embl.org www.embl.org]&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成.2002 年，PIR 与其国际合作伙伴 EBI（欧洲生物信息学研究所）和 SIB（瑞士生物信息学研究所）一起获得了 NIH 的资助，创建了 UniProt。 通过统一 PIR-PSD、Swiss-Prot 和 TrEMBL 数据库，实现蛋白质序列和功能的单一全球数据库。&lt;br /&gt;
* Uniprot提供亚细胞定位，翻译后修饰&lt;br /&gt;
* Uniprot是包含蛋白质序列，功能信息，论文索引的蛋白质数据库，整合了包括EBI,SIB,PIR三大数据库的资源。&lt;br /&gt;
**EMBL-EBI是指欧洲生物信息学研究所（European Bioinformatics Institute），EMBL的一部分。1982年建立了先进的核苷酸序列数据库（EMBL-DNA），可进行核苷酸序列检索及序列相似性查询。TrEMBL&lt;br /&gt;
**SIB,瑞士生物信息学研究所，维护着ExPASy的服务器,Swissprot&lt;br /&gt;
*** &#039;&#039;&#039;ExPASy&#039;&#039;&#039;是一个集成了多种生物信息学工具和数据库的平台，专门用于蛋白质和蛋白质组学的研究。除了蛋白质相关的数据外，ExPASy还提供了其他生物信息学资源，如代谢通路数据库（KEGG京都代谢通路基因什么什么库）等。其中，Protparam工具是经常使用的功能，它可以根据蛋白质序列估计蛋白质的等电点（pi）、疏水性等特性。&lt;br /&gt;
**** Protscale判断蛋白质序列的疏水性，返回的结果是疏水性曲线，亲水用负值表示,疏水用正值表示。原理是滑动窗口&lt;br /&gt;
**** Prosite数据库是一个用于存储和提供蛋白质序列和结构特征的资源。 主要功能是提供蛋白质的功能和结构信息可以识别功能域和模式，可用于蛋白质家族和亲缘关系的研究，预测蛋白质结构与功能&lt;br /&gt;
** PIR &#039;&#039;&#039;Protein information resource&#039;&#039;&#039;，由美国国家生物医学研究基金会（NBRF）于1984年成立,用于支持基因组学、蛋白质组学和系统生物学研究和科学研究。提供蛋白质数据库和分析工具，包括蛋白质序列数据库 （PSD）。PIR-PSD&lt;br /&gt;
*数据库的关系&lt;br /&gt;
通过INSDC等得到原始数据，处理后存入UniParc。&lt;br /&gt;
&lt;br /&gt;
UniParc作为数据仓库，再分别给UniProtKB，Proteomes，UniRef提供可靠的数据集。&lt;br /&gt;
这里的UniProtKB 由两个子库构成 Swiss-Prot，TrEMBL。&lt;br /&gt;
&lt;br /&gt;
Swiss-Prot 经过人工验证和注释，是高质量的蛋白质注释数据。但人工效率在高速增长的蛋白质数据面前显得极其低效。因此，注释这些数据需要大量时间，为了弥补这一问题。TrEMBL 被建立用于存储由机器自动翻译和预测的蛋白质序列。导致蛋白质数据冗余↑可信度↓。&lt;br /&gt;
&lt;br /&gt;
简而言之，在UniProtKB数据库中Swiss-Prot是由TrEMBL经过手动注释后得到的高质量非冗余数据库，也是我们今后常用的蛋白质数据库之一。&lt;br /&gt;
&lt;br /&gt;
[https://zhuanlan.zhihu.com/p/599641613 感谢知乎qwq]&lt;br /&gt;
&lt;br /&gt;
*Uniprot内部有UniPrac，Uniref，UniProtKB三层，由粗糙到精细列&lt;br /&gt;
** 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。UniParc由于数据冗余，将相同序列合并一条，唯一编号。&lt;br /&gt;
** 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
** 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&amp;lt;TrEMBL和Swissprot热血沸腾的组合技&amp;gt;&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&lt;br /&gt;
== 蛋白质结构数据库 ==&lt;br /&gt;
&lt;br /&gt;
=== 一级结构数据库 ===&lt;br /&gt;
PDB蛋白质结构数据库(Protein Data Bank)是美国Brookhaven国家实验室于1971年创建的，由结构生物信息学研究合作组织(RCSB)维护。&lt;br /&gt;
* PDB数据库以文本文件形式存储分子数据，每个分子形用一个独立的文件。早期的分子文件的文件名后缀为“.pdb”，1997年以后每1种生物大分子对应1组(3个)相关文件分别是：全文文件(后缀为“.full”相当于原来的“.pdb”文件)、书目文件(后缀为“.biblio”)和图形文件(后缀为“.gif”)。&lt;br /&gt;
* PDB数据库是生物大分子的原子坐标和描述蛋白质和其他重要生物大分子相关信息的存储库。结构生物学家使用x 射线晶体学、核磁共振光谱和冷冻电子显微镜等方法来确定分子中每个原子相对于彼此的位置，然后存储这些信息，并由PDB数据库注释并公开发布到档案中。&lt;br /&gt;
**[https://zhuanlan.zhihu.com/p/589697113/]&lt;br /&gt;
[https://www.rcsb.org/]&lt;br /&gt;
&lt;br /&gt;
=== 二级结构数据库 ===&lt;br /&gt;
DSSP工具：DSSP程序是一个二级结构分配（以及更多信息）的数据库，涵盖PDB中的所有蛋白质条目。DSSP也是从PDB条目计算DSSP条目的程序。DSSP并不预测二级结构。&lt;br /&gt;
&lt;br /&gt;
* 根据氢键模式和主链构象，将蛋白质的每个残基分类为特定的二级结构类型。算残基之间的氢键能量，用于确定二级结构的边界。计算每个残基的溶剂可及表面积（ASA），反映其在蛋白质表面的暴露程度。&lt;br /&gt;
* 输入：蛋白质的三维结构文件（通常为PDB格式）。输出：包含每个残基的二级结构类型、氢键信息、溶剂可及性等数据的文本文件。&lt;br /&gt;
&lt;br /&gt;
Pfam数据库重视&#039;&#039;&#039;蛋白质结构域和家族&#039;&#039;&#039;（基于序列同源性）分为Pfam-A和Pfam-B。。Pfam数据库主要用于蛋白质家族的分类和功能注释。&lt;br /&gt;
&lt;br /&gt;
* Pfam-A是手工整理的高质量家族集合，&lt;br /&gt;
* Pfam-B是自动生成的家族集合，具有更广泛但相对较低的准确性&lt;br /&gt;
&lt;br /&gt;
* 关注功能相关的蛋白质区域（如结构域），而非完整蛋白质的结构。&lt;br /&gt;
&lt;br /&gt;
* 分类依据：&lt;br /&gt;
** &#039;&#039;&#039;序列相似性&#039;&#039;&#039;，通过隐马尔可夫模型（HMM）比对识别保守区域。&lt;br /&gt;
** 基于多序列比对和进化关系。&lt;br /&gt;
&lt;br /&gt;
* 层次结构：&lt;br /&gt;
** 超家族（Clan）：多个家族在进化或功能上的关联。&lt;br /&gt;
** 家族（Family）：具有显著序列相似性的结构域集合&lt;br /&gt;
* Pfam的链接都已经重新定位到Interpro了,也是EMBL-EBI生的&lt;br /&gt;
&lt;br /&gt;
CATH数据库提供蛋白质三维结构与分类，关注&#039;&#039;&#039;结构的拓扑和进化起源&#039;&#039;&#039;。&lt;br /&gt;
&lt;br /&gt;
* 蛋白质三维结构的层次化分类（从二级结构到进化关系）以三维结构特征为依据，结合序列和功能信息进行分类&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构组成（如全α、全β、α+β、α/β）。&lt;br /&gt;
*# Architecture（架构）：描述二级结构的空间排布（如β桶、α螺旋束）。&lt;br /&gt;
*# Topology（拓扑）：基于折叠方式和连接性。&lt;br /&gt;
*# Homologous Superfamily&#039;&#039;&#039;（&#039;&#039;&#039;同源超家族）：进化相关的蛋白质。&lt;br /&gt;
&lt;br /&gt;
SCOP数据库分类强调进化同源性，基于结构与进化关系分类，由&#039;&#039;&#039;专家手动分类，强调超家族内的远缘同源关系。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构类型（如全α、全β等）。&lt;br /&gt;
*# Fold（折叠方式）：具有相似拓扑结构的蛋白质。&lt;br /&gt;
*# Superfamily（超家族）：推测具有共同祖先的结构相似蛋白质。&lt;br /&gt;
*# Family（家族）：明确序列同源性的蛋白质集合。&lt;br /&gt;
&lt;br /&gt;
* SCOPe引入自动化分类，但核心仍保留手动注释。&lt;br /&gt;
&amp;lt;这段deepseek写的，我对着笔记查了一下&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== 搞人小数据库，考了之后就把名字全记下来了 ==&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质三级结构预测 ===&lt;br /&gt;
* I-TASSER穿线法预测：有相似才能用从PDB中识别结构模板，并通过基于迭代模板的碎片组装模拟构建完整的原子模型(将蛋白质“穿入”已有的蛋白质结构模板)。 接着通过蛋白质功能数据库BioLiP对3D模型进行重新线程化，从而预测功能。&lt;br /&gt;
** 有人把ITASSER归进从头建模了&lt;br /&gt;
&lt;br /&gt;
* Swissmodel同源建模：按照FASTA格式输入氨基酸序列，要有相似度&amp;gt;30%的蛋白质模板&lt;br /&gt;
** 同源建模也称为比较建模，根据与已知结构的序列同源性预测蛋白质结构。基于“如果两个蛋白质具有足够高的序列相似性，它们很可能具有非常相似的三维结构”的原理。如果蛋白质序列之一具有已知结构，则可以以高置信度将该结构复制/映射到未知蛋白质。&lt;br /&gt;
** 质量评估：其中相似度值，即序列同源性经比对后结果在 40% 以上，则待预测蛋白与模板蛋白结构大概为同源蛋白，则同源建模方法可用于预测该蛋白三维结构。根据GMQE值及ＱＭEAN值评价结果，都是全局比对。&lt;br /&gt;
*** GMQE值在0－1之间，越接近１则建模质量越好&lt;br /&gt;
*** QMEAN值关于覆盖率区间为－４－０，越接近０则匹配度越好。&lt;br /&gt;
** 此功能在Modelle(蛋白质复合体同源建模)与Discovery Studio与AlphaFold-Multimer亦有记载&lt;br /&gt;
* QUARK从头计算：从头经历复杂的算法归纳到能量最低，此事在Alphafold亦有记载&lt;br /&gt;
* Rosetta综合以上算法，但亦有说同源建模的&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质功能与结构域数据库&amp;amp;预测 ===&lt;br /&gt;
&lt;br /&gt;
* InterPro是集成的蛋白质结构域和功能位点数据库，包含关于蛋白质家族、域、重复序列、和作用位点等数据资源。InterPro通过将蛋白质分类为家族并预测结构域和重要位点来提供蛋白质的功能分析。为了以这种方式对蛋白质进行分类，InterPro 使用由组成 InterPro 联盟的多个不同数据库（称为成员数据库）提供的预测模型（称为特征）。&lt;br /&gt;
** InterPro包含很多来自不同数据库的人工注释文件，形成了一个给定的蛋白质家族、结构域和功能位点的独特描述。&lt;br /&gt;
** Interpro数据库成员包括Coils 、Gene3D、Pfam、PRINTS、ProSitePatterns、ProSiteProfiles、SMART、SUPERFAMILY、 TIGRFAM、ProDom、PIR 数据库，每两个月更新一次&lt;br /&gt;
** EBI生的，可能假阳性&lt;br /&gt;
* Pfam数据库是一个庞大的蛋白质家族集合，每个家族都由多个序列比对和隐马尔可夫模型（HMMs）表示&lt;br /&gt;
* SMART 是一个用于蛋白质结构域鉴定、注释的在线分析工具。它的数据与UniProt、Ensembl和STRING数据库同步&lt;br /&gt;
** 您可以在两种不同的模式下使用 SMART：&#039;&#039;&#039;正常&#039;&#039;&#039;模式或&#039;&#039;&#039;基因组&#039;&#039;&#039;模式。主要区别在于所使用的基础蛋白质数据库。&lt;br /&gt;
** 在 &#039;&#039;&#039;Normal SMART&#039;&#039;&#039; 中，数据库包含 Swiss-Prot、SP-TrEMBL 和稳定的 Ensembl 蛋白质组。即使删除了相同的蛋白质，Normal SMART 中的蛋白质数据库具有显著的冗余性，&lt;br /&gt;
** 在 &#039;&#039;&#039;Genomic SMART&#039;&#039;&#039; 中，仅使用完全测序基因组的蛋白质组;后生动物的 Ensembl 和其余的 Swiss-Prot。如果您使用 SMART 来探索结构域架构，或者想要在各种基因组中查找确切的结构域计数，请考虑切换到&#039;&#039;&#039;基因组&#039;&#039;&#039;模式。结构域标注页中的数字会更准确，架构查询结果中不会有很多对应同一个基因的蛋白片段。&lt;br /&gt;
&lt;br /&gt;
=== 蛋白相互作用库 ===&lt;br /&gt;
&lt;br /&gt;
* DIP&amp;lt;sup&amp;gt;TM&amp;lt;/sup&amp;gt; 数据库对实验确定的蛋白质之间的相互作用进行了编目。它结合了来自各种来源的信息，以创建一组单一、一致的蛋白质-蛋白质相互作用。存储在 DIP 数据库中的数据既由专家策展人手动管理，也使用计算方法自动管理&lt;br /&gt;
* BioGRID(Biological General Repository for Interaction Datasets)数据库 生物相互作用网络，是由大量单个蛋白质或遗传相互作用以及RNA，DNA，膜，碳水化合物和小分子代谢物的相互作用聚集形成的，BioGRID致力于所有主要模式生物物种和人类的蛋白质，遗传和药物相互作用的管理和存[https://www.jianshu.com/p/63a5834c2fe9 储]&lt;br /&gt;
** 合并了DrugBank中的化学-蛋白质相互作用记录&lt;br /&gt;
** 为了协调和统一不同模式生物研究中使用的各种遗传相互作用术语，BioGRID与WormBase([https://wormbase.org/#012-34-5 线虫数据库])合作开发了新的标准化遗传相互作用结构术语或GIST。GIST已设计为使用通用遗传相互作用术语精确指定遗传相互作用&lt;br /&gt;
** BioGRID ORCS：用于CRISPR筛选数据的存储单元&lt;br /&gt;
* STRING功能性蛋白质关联网络。收集多个公共数据库，包括UniProt、KEGG、NCBI和Gene Ontology整合并生成一个全面的蛋白质相互作用网络数据库。&lt;br /&gt;
** 返回结果是网状的蛋白质互作消息&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质多序列比对 ===&lt;br /&gt;
多序列比对MSA是指把多条（3 条或以上）有系统进化关系的蛋白质分子的氨基酸序列或核酸序列进行比对，尽可能地把相同的碱基或氨基酸残基排在同一列上。对齐的碱基或氨基酸残基在进化上是同源的，即来自共同祖先。&lt;br /&gt;
&lt;br /&gt;
序列比对主要是为了寻找相似的序列，相似的序列往往起源于一个共同的祖先序列，它们很可能有相似的空间结构和生物学功能，有利于推测这个未知结构和功能的蛋白质的结构和功能。&lt;br /&gt;
&lt;br /&gt;
* Tcoffee核酸和蛋白质都可以&lt;br /&gt;
** 基本原理是首先构建一个包含有clustalw得到的序列两两比对和fasta得到的局部两两比对数据的库,并且给每个比对一个权重.然后把结果进行整合,最后是progressive比对过程.&lt;br /&gt;
** Rcoffee可以根据预测的RNA二级结构对比序列&lt;br /&gt;
* ClustralW有快慢两种模式，&lt;br /&gt;
** 原理是两两比对-&amp;gt;两两之间距离矩阵-&amp;gt;NJ建Binary进化树作为guidetree-&amp;gt;用progressive的方法添加序列到树上直到比对完成&lt;br /&gt;
** 有Accurate慢和Appropriate快两种模式，Accruate比Tcoffee快，Appropriate比Muscle慢&lt;br /&gt;
* Muscle&lt;br /&gt;
** 它之所以比clustalw快一方面是因为没有进行两两序列比对,用序列间共有的word数表征序列间的相似性;另一方面用UPGMA代替NJ构建guide tree. 如果没有对于结果的refinement过程,时间更短,时间复杂度为O(NL^2),也就是说时间和序列数成线性关系.&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质数据质量评估 ===&lt;br /&gt;
&lt;br /&gt;
* PROCHECK&lt;br /&gt;
** 在对蛋白的二级结构进行评估之时,一个重要的指标就是二面角φ, ψ是否在合理范围之内, 其中φ代表 α 碳原子和氮原子间的键的旋转度phi, ψ代表α碳原子和羰基碳原子间的键的旋转度。PROCHECK可以计算给定PDB文件的所有φ, ψ二面角, 然后给出总的评估结果,并将结果绘制成Ramachandran图表示。&lt;br /&gt;
** 不少于90%的二面角分布在图中的合理(蓝色)区域，则蛋白结构合理&lt;br /&gt;
* VERIFY_3D&lt;br /&gt;
** 对同源建模所得模型的质量进行了可视化分析，用来判断模型与氨基酸序列之间的兼容性。&lt;br /&gt;
** 对氨基酸残基数大于100的蛋白质，VERIFY_3D的评估结果更准确。&lt;br /&gt;
** 当不低于80%的氨基酸残基得分大 0.2时，即可认为目的蛋白建模所得模型属于高质量的模型结构。&lt;br /&gt;
* [https://proq.bioinfo.se/ProQ/ProQ.html ProQ - 蛋白质质量评价]&amp;lt;这个没找到总结&amp;gt; ProQ 是一种基于神经网络的预测器，它基于许多 结构特征可预测蛋白质模型的质量。ProQ 是 优化以找到正确的模型，与其他方法相比 经过优化以查找原生结构。两个质量衡量标准是 预测 LGscore 和 MaxSub。  LGscore 是 P 值的 -log，MaxSub 范围为 0-1，其中 0 为 微不足道和 1 个非常显著。&lt;br /&gt;
&lt;br /&gt;
=== 跨膜序列预测 ===&lt;br /&gt;
&lt;br /&gt;
* TMHMM由丹麦的CBS维护，使用隐马尔可夫模型预测跨膜蛋白序列&lt;br /&gt;
&lt;br /&gt;
* TMpred预测蛋白质的跨膜结构域（TMDs），基于氨基酸疏水性分析。输入蛋白质序列，输出跨膜区的位置、与拓扑结构（膜内/膜外方向）&lt;br /&gt;
&lt;br /&gt;
=== 信号肽SignalP ===&lt;br /&gt;
&lt;br /&gt;
* 预测蛋白质的 信号肽及其切割位点，判断是否为分泌蛋白或膜蛋白。&lt;br /&gt;
* &#039;&#039;&#039;输入&#039;&#039;&#039;：蛋白质序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：信号肽位置、切割位点概率、分泌类型（Sec/SPI/Tat）。&lt;br /&gt;
&lt;br /&gt;
=== 调控元件与内含子/外显子 ===&lt;br /&gt;
&lt;br /&gt;
* PLACE&#039;&#039;&#039;植物顺式作用元件数据库&#039;&#039;&#039;（Plant Cis-Acting Regulatory DNA Elements），存储植物启动子区域的功能性调控元件。&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：DNA序列（如启动子区域）。&#039;&#039;&#039;输出&#039;&#039;&#039;：匹配的调控元件名称、位置及功能注释。&lt;br /&gt;
* Augustus真核生物基因结构预测&lt;br /&gt;
** 基于隐马尔可夫模型（HMM）和物种特异性训练数据预测基因结构。&lt;br /&gt;
*** 可以直接预测训练之后的物种。若不存在被训练过的物种，需要[https://www.jianshu.com/p/6f7b2998600c 准备训练集和测试集进行训练]  可靠的基因结构序列的要求如下： 之后随机将注释数据集分成训练集和测试集，测试集要足够多的基因（100~200个），并且要足够的随机。  a. 提供基因的编码部分，包含上游几KB。通常，基因越多越好。还得保证有足够多的外显子，这样子才能训练内含子  b. 这些基因的基因结构一定足够准确。不过，也不需要百分百正确，只要保证起始密码子和终止密码子是准确的。  c. 需要保证这些基因没有冗余，不同序列如果有几乎相同的注释后氨基酸序列，那么仅仅取其中一个  d. 一条序列允许有多个基因，基因可以在正链也可以在负链，但是这些基因间不能有重叠，每个基因只要其中一个转录本，存放格式是GenBank&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：基因组DNA序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：预测的基因模型（外显子、内含子、CDS区域）、蛋白质序列。&lt;br /&gt;
* ORFfinder&lt;br /&gt;
** 识别DNA序列中的 开放阅读框ORF，基于遗传密码表扫描可能的编码区域。&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：DNA序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：ORF的位置、长度、翻译的氨基酸序列。&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质物理特性识别 ===&lt;br /&gt;
Compute pI/Mw&lt;br /&gt;
&lt;br /&gt;
* 计算蛋白质的 &#039;&#039;&#039;等电点（pI） 和 分子量（Mw）&#039;&#039;&#039;，基于氨基酸序列的电荷分布和组成。&lt;br /&gt;
* &#039;&#039;&#039;输入&#039;&#039;&#039;：蛋白质氨基酸序列（FASTA格式）。&#039;&#039;&#039;输出&#039;&#039;&#039;：pI和Mw的数值结果。&lt;br /&gt;
ExPasy的protogram数据库亦有记载&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质修饰预测 ===&lt;br /&gt;
NMT蛋白质甲基化预测&lt;br /&gt;
&lt;br /&gt;
NetPho蛋白质磷酸化预测&lt;br /&gt;
&lt;br /&gt;
NetAcet蛋白质乙酰化&lt;br /&gt;
&lt;br /&gt;
=== 基因比对 ===&lt;br /&gt;
BWA-MEM自动选择全局/局部算法，长序列更适合&lt;br /&gt;
&lt;br /&gt;
SOAP快，短序列更加合适&lt;br /&gt;
&lt;br /&gt;
NovoAlign慢而准确&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4917</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4917"/>
		<updated>2025-03-17T14:40:09Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* 搞人小数据库，考了之后就把名字全记下来了 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
国际核苷酸序列数据库协作 （INSDC），包含NLM-NCBI(美国）,ENA(欧洲,EMBL与EBI参与),DDBJ(日本),&lt;br /&gt;
&lt;br /&gt;
其创始成员是信息和系统研究组织、日本国家遗传学研究所 （ROIS-NIG）、欧洲分子生物学实验室 - 欧洲生物信息学研究所 （EMBL-EBI） 和美国国立卫生研究院的一个组成部分,国家医学图书馆-国家生物技术信息中心 （NLM-NCBI）。&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
PubMed诞生于1996年。最常用的文摘型数据库。其收录范围不仅包括Medline，还有大部分PMC和NIH基金资助作者的文献，NCBI书籍等。PubMed还提供链接到文献全文所在网站的全文链接。早期 PubMed 数据库主要的任务，是将 Mesh 目录(MEDlINE的早期目录，主题词表)中收录的医学主题与大量有关医学研究的文献相匹配。这意味着，PubMed最早的发布时间应该是在 1971 年，也就是 MEDLINE 数据库第一次正式发布的时间。&lt;br /&gt;
&lt;br /&gt;
MEDLINE始建于1966年（追溯收录至1946年），是NLM的期刊文献记录数据库。1983年，MEDLINE推出电子版，网上数据每日更新，光盘版每月更新。MEDLINE有严格的文献选择委员会LSTRC进行选刊。目前MEDLINE的文献都收录在PubMed中。&lt;br /&gt;
&lt;br /&gt;
PMC全称为PubMed Central，建立于2000年，由NCBI进行管理，是可以免费获取全文的生物医学和生命科学全文数据库，保存了NLM收录印刷杂志的电子副本。PMC的部分bookreview内容没有收录于PubMed。&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签数据库，由NCBI维护&lt;br /&gt;
** ESTs是从不同生物体中提取的短序列片段，通常是基因的转录产物。这些ESTs是通过cDNA文库构建和测序获得的，可以提供有关特定基因的信息。ESTs的测序往往是高通量的，可以快速识别和记录大量的基因序列。&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
** psi-BLAST用位置特异权重矩阵搜索，适合远缘物种相似蛋白/家族新蛋白&lt;br /&gt;
** phi-BLAST模式发现迭代BLAST，仅输出序列中含有特殊模式的对齐&lt;br /&gt;
*** 精准度phiBLAST&amp;gt;BLASTp&amp;gt;psiBLAST,范围psiBLAST&amp;gt;BLASTp&amp;gt;phiBLAST&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== EMBL（European Molecular Biology Laboratory）欧洲分子生物学实验室 ==&lt;br /&gt;
总部位于德国海德堡，1974年由欧洲14个国家加上亚洲的以色列共同发起建立，现在由欧洲29个成员国政府支持组成，目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。&lt;br /&gt;
&lt;br /&gt;
[https://www.embl.org www.embl.org]&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成.2002 年，PIR 与其国际合作伙伴 EBI（欧洲生物信息学研究所）和 SIB（瑞士生物信息学研究所）一起获得了 NIH 的资助，创建了 UniProt。 通过统一 PIR-PSD、Swiss-Prot 和 TrEMBL 数据库，实现蛋白质序列和功能的单一全球数据库。&lt;br /&gt;
* Uniprot提供亚细胞定位，翻译后修饰&lt;br /&gt;
* Uniprot是包含蛋白质序列，功能信息，论文索引的蛋白质数据库，整合了包括EBI,SIB,PIR三大数据库的资源。&lt;br /&gt;
**EMBL-EBI是指欧洲生物信息学研究所（European Bioinformatics Institute），EMBL的一部分。1982年建立了先进的核苷酸序列数据库（EMBL-DNA），可进行核苷酸序列检索及序列相似性查询。TrEMBL&lt;br /&gt;
**SIB,瑞士生物信息学研究所，维护着ExPASy的服务器,Swissprot&lt;br /&gt;
*** &#039;&#039;&#039;ExPASy&#039;&#039;&#039;是一个集成了多种生物信息学工具和数据库的平台，专门用于蛋白质和蛋白质组学的研究。除了蛋白质相关的数据外，ExPASy还提供了其他生物信息学资源，如代谢通路数据库（KEGG京都代谢通路基因什么什么库）等。其中，Protparam工具是经常使用的功能，它可以根据蛋白质序列估计蛋白质的等电点（pi）、疏水性等特性。&lt;br /&gt;
**** Protscale判断蛋白质序列的疏水性，返回的结果是疏水性曲线，亲水用负值表示,疏水用正值表示。原理是滑动窗口&lt;br /&gt;
**** Prosite数据库是一个用于存储和提供蛋白质序列和结构特征的资源。 主要功能是提供蛋白质的功能和结构信息可以识别功能域和模式，可用于蛋白质家族和亲缘关系的研究，预测蛋白质结构与功能&lt;br /&gt;
** PIR &#039;&#039;&#039;Protein information resource&#039;&#039;&#039;，由美国国家生物医学研究基金会（NBRF）于1984年成立,用于支持基因组学、蛋白质组学和系统生物学研究和科学研究。提供蛋白质数据库和分析工具，包括蛋白质序列数据库 （PSD）。PIR-PSD&lt;br /&gt;
*数据库的关系&lt;br /&gt;
通过INSDC等得到原始数据，处理后存入UniParc。&lt;br /&gt;
&lt;br /&gt;
UniParc作为数据仓库，再分别给UniProtKB，Proteomes，UniRef提供可靠的数据集。&lt;br /&gt;
这里的UniProtKB 由两个子库构成 Swiss-Prot，TrEMBL。&lt;br /&gt;
&lt;br /&gt;
Swiss-Prot 经过人工验证和注释，是高质量的蛋白质注释数据。但人工效率在高速增长的蛋白质数据面前显得极其低效。因此，注释这些数据需要大量时间，为了弥补这一问题。TrEMBL 被建立用于存储由机器自动翻译和预测的蛋白质序列。导致蛋白质数据冗余↑可信度↓。&lt;br /&gt;
&lt;br /&gt;
简而言之，在UniProtKB数据库中Swiss-Prot是由TrEMBL经过手动注释后得到的高质量非冗余数据库，也是我们今后常用的蛋白质数据库之一。&lt;br /&gt;
&lt;br /&gt;
[https://zhuanlan.zhihu.com/p/599641613 感谢知乎qwq]&lt;br /&gt;
&lt;br /&gt;
*Uniprot内部有UniPrac，Uniref，UniProtKB三层，由粗糙到精细列&lt;br /&gt;
** 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。UniParc由于数据冗余，将相同序列合并一条，唯一编号。&lt;br /&gt;
** 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
** 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&amp;lt;TrEMBL和Swissprot热血沸腾的组合技&amp;gt;&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&lt;br /&gt;
== 蛋白质结构数据库 ==&lt;br /&gt;
&lt;br /&gt;
=== 一级结构数据库 ===&lt;br /&gt;
PDB蛋白质结构数据库(Protein Data Bank)是美国Brookhaven国家实验室于1971年创建的，由结构生物信息学研究合作组织(RCSB)维护。&lt;br /&gt;
* PDB数据库以文本文件形式存储分子数据，每个分子形用一个独立的文件。早期的分子文件的文件名后缀为“.pdb”，1997年以后每1种生物大分子对应1组(3个)相关文件分别是：全文文件(后缀为“.full”相当于原来的“.pdb”文件)、书目文件(后缀为“.biblio”)和图形文件(后缀为“.gif”)。&lt;br /&gt;
* PDB数据库是生物大分子的原子坐标和描述蛋白质和其他重要生物大分子相关信息的存储库。结构生物学家使用x 射线晶体学、核磁共振光谱和冷冻电子显微镜等方法来确定分子中每个原子相对于彼此的位置，然后存储这些信息，并由PDB数据库注释并公开发布到档案中。&lt;br /&gt;
**[https://zhuanlan.zhihu.com/p/589697113/]&lt;br /&gt;
[https://www.rcsb.org/]&lt;br /&gt;
&lt;br /&gt;
=== 二级结构数据库 ===&lt;br /&gt;
DSSP工具：DSSP程序是一个二级结构分配（以及更多信息）的数据库，涵盖PDB中的所有蛋白质条目。DSSP也是从PDB条目计算DSSP条目的程序。DSSP并不预测二级结构。&lt;br /&gt;
&lt;br /&gt;
* 根据氢键模式和主链构象，将蛋白质的每个残基分类为特定的二级结构类型。算残基之间的氢键能量，用于确定二级结构的边界。计算每个残基的溶剂可及表面积（ASA），反映其在蛋白质表面的暴露程度。&lt;br /&gt;
* 输入：蛋白质的三维结构文件（通常为PDB格式）。输出：包含每个残基的二级结构类型、氢键信息、溶剂可及性等数据的文本文件。&lt;br /&gt;
&lt;br /&gt;
Pfam数据库重视&#039;&#039;&#039;蛋白质结构域和家族&#039;&#039;&#039;（基于序列同源性）分为Pfam-A和Pfam-B。。Pfam数据库主要用于蛋白质家族的分类和功能注释。&lt;br /&gt;
&lt;br /&gt;
* Pfam-A是手工整理的高质量家族集合，&lt;br /&gt;
* Pfam-B是自动生成的家族集合，具有更广泛但相对较低的准确性&lt;br /&gt;
&lt;br /&gt;
* 关注功能相关的蛋白质区域（如结构域），而非完整蛋白质的结构。&lt;br /&gt;
&lt;br /&gt;
* 分类依据：&lt;br /&gt;
** &#039;&#039;&#039;序列相似性&#039;&#039;&#039;，通过隐马尔可夫模型（HMM）比对识别保守区域。&lt;br /&gt;
** 基于多序列比对和进化关系。&lt;br /&gt;
&lt;br /&gt;
* 层次结构：&lt;br /&gt;
** 超家族（Clan）：多个家族在进化或功能上的关联。&lt;br /&gt;
** 家族（Family）：具有显著序列相似性的结构域集合&lt;br /&gt;
* Pfam的链接都已经重新定位到Interpro了,也是EMBL-EBI生的&lt;br /&gt;
&lt;br /&gt;
CATH数据库提供蛋白质三维结构与分类，关注&#039;&#039;&#039;结构的拓扑和进化起源&#039;&#039;&#039;。&lt;br /&gt;
&lt;br /&gt;
* 蛋白质三维结构的层次化分类（从二级结构到进化关系）以三维结构特征为依据，结合序列和功能信息进行分类&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构组成（如全α、全β、α+β、α/β）。&lt;br /&gt;
*# Architecture（架构）：描述二级结构的空间排布（如β桶、α螺旋束）。&lt;br /&gt;
*# Topology（拓扑）：基于折叠方式和连接性。&lt;br /&gt;
*# Homologous Superfamily&#039;&#039;&#039;（&#039;&#039;&#039;同源超家族）：进化相关的蛋白质。&lt;br /&gt;
&lt;br /&gt;
SCOP数据库分类强调进化同源性，基于结构与进化关系分类，由&#039;&#039;&#039;专家手动分类，强调超家族内的远缘同源关系。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构类型（如全α、全β等）。&lt;br /&gt;
*# Fold（折叠方式）：具有相似拓扑结构的蛋白质。&lt;br /&gt;
*# Superfamily（超家族）：推测具有共同祖先的结构相似蛋白质。&lt;br /&gt;
*# Family（家族）：明确序列同源性的蛋白质集合。&lt;br /&gt;
&lt;br /&gt;
* SCOPe引入自动化分类，但核心仍保留手动注释。&lt;br /&gt;
&amp;lt;这段deepseek写的，我对着笔记查了一下&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== 搞人小数据库，考了之后就把名字全记下来了 ==&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质三级结构预测 ===&lt;br /&gt;
* I-TASSER穿线法预测：有相似才能用从PDB中识别结构模板，并通过基于迭代模板的碎片组装模拟构建完整的原子模型(将蛋白质“穿入”已有的蛋白质结构模板)。 接着通过蛋白质功能数据库BioLiP对3D模型进行重新线程化，从而预测功能。&lt;br /&gt;
** 有人把ITASSER归进从头建模了&lt;br /&gt;
&lt;br /&gt;
* Swissmodel同源建模：按照FASTA格式输入氨基酸序列，要有相似度&amp;gt;30%的蛋白质模板&lt;br /&gt;
** 同源建模也称为比较建模，根据与已知结构的序列同源性预测蛋白质结构。基于“如果两个蛋白质具有足够高的序列相似性，它们很可能具有非常相似的三维结构”的原理。如果蛋白质序列之一具有已知结构，则可以以高置信度将该结构复制/映射到未知蛋白质。&lt;br /&gt;
** 质量评估：其中相似度值，即序列同源性经比对后结果在 40% 以上，则待预测蛋白与模板蛋白结构大概为同源蛋白，则同源建模方法可用于预测该蛋白三维结构。根据GMQE值及ＱＭEAN值评价结果，都是全局比对。&lt;br /&gt;
*** GMQE值在0－1之间，越接近１则建模质量越好&lt;br /&gt;
*** QMEAN值关于覆盖率区间为－４－０，越接近０则匹配度越好。&lt;br /&gt;
** 此功能在Modelle(蛋白质复合体同源建模)与Discovery Studio与AlphaFold-Multimer亦有记载&lt;br /&gt;
* QUARK从头计算：从头经历复杂的算法归纳到能量最低，此事在Alphafold亦有记载&lt;br /&gt;
* Rosetta综合以上算法，但亦有说同源建模的&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质功能与结构域数据库&amp;amp;预测 ===&lt;br /&gt;
&lt;br /&gt;
* InterPro是集成的蛋白质结构域和功能位点数据库，包含关于蛋白质家族、域、重复序列、和作用位点等数据资源。InterPro通过将蛋白质分类为家族并预测结构域和重要位点来提供蛋白质的功能分析。为了以这种方式对蛋白质进行分类，InterPro 使用由组成 InterPro 联盟的多个不同数据库（称为成员数据库）提供的预测模型（称为特征）。&lt;br /&gt;
** InterPro包含很多来自不同数据库的人工注释文件，形成了一个给定的蛋白质家族、结构域和功能位点的独特描述。&lt;br /&gt;
** Interpro数据库成员包括Coils 、Gene3D、Pfam、PRINTS、ProSitePatterns、ProSiteProfiles、SMART、SUPERFAMILY、 TIGRFAM、ProDom、PIR 数据库，每两个月更新一次&lt;br /&gt;
** EBI生的，可能假阳性&lt;br /&gt;
* Pfam数据库是一个庞大的蛋白质家族集合，每个家族都由多个序列比对和隐马尔可夫模型（HMMs）表示&lt;br /&gt;
* SMART 是一个用于蛋白质结构域鉴定、注释的在线分析工具。它的数据与UniProt、Ensembl和STRING数据库同步&lt;br /&gt;
** 您可以在两种不同的模式下使用 SMART：&#039;&#039;&#039;正常&#039;&#039;&#039;模式或&#039;&#039;&#039;基因组&#039;&#039;&#039;模式。主要区别在于所使用的基础蛋白质数据库。&lt;br /&gt;
** 在 &#039;&#039;&#039;Normal SMART&#039;&#039;&#039; 中，数据库包含 Swiss-Prot、SP-TrEMBL 和稳定的 Ensembl 蛋白质组。即使删除了相同的蛋白质，Normal SMART 中的蛋白质数据库具有显著的冗余性，&lt;br /&gt;
** 在 &#039;&#039;&#039;Genomic SMART&#039;&#039;&#039; 中，仅使用完全测序基因组的蛋白质组;后生动物的 Ensembl 和其余的 Swiss-Prot。如果您使用 SMART 来探索结构域架构，或者想要在各种基因组中查找确切的结构域计数，请考虑切换到&#039;&#039;&#039;基因组&#039;&#039;&#039;模式。结构域标注页中的数字会更准确，架构查询结果中不会有很多对应同一个基因的蛋白片段。&lt;br /&gt;
&lt;br /&gt;
=== 蛋白相互作用库 ===&lt;br /&gt;
&lt;br /&gt;
* DIP&amp;lt;sup&amp;gt;TM&amp;lt;/sup&amp;gt; 数据库对实验确定的蛋白质之间的相互作用进行了编目。它结合了来自各种来源的信息，以创建一组单一、一致的蛋白质-蛋白质相互作用。存储在 DIP 数据库中的数据既由专家策展人手动管理，也使用计算方法自动管理&lt;br /&gt;
* BioGRID(Biological General Repository for Interaction Datasets)数据库 生物相互作用网络，是由大量单个蛋白质或遗传相互作用以及RNA，DNA，膜，碳水化合物和小分子代谢物的相互作用聚集形成的，BioGRID致力于所有主要模式生物物种和人类的蛋白质，遗传和药物相互作用的管理和存[https://www.jianshu.com/p/63a5834c2fe9 储]&lt;br /&gt;
** 合并了DrugBank中的化学-蛋白质相互作用记录&lt;br /&gt;
** 为了协调和统一不同模式生物研究中使用的各种遗传相互作用术语，BioGRID与WormBase([https://wormbase.org/#012-34-5 线虫数据库])合作开发了新的标准化遗传相互作用结构术语或GIST。GIST已设计为使用通用遗传相互作用术语精确指定遗传相互作用&lt;br /&gt;
** BioGRID ORCS：用于CRISPR筛选数据的存储单元&lt;br /&gt;
* STRING功能性蛋白质关联网络。收集多个公共数据库，包括UniProt、KEGG、NCBI和Gene Ontology整合并生成一个全面的蛋白质相互作用网络数据库。&lt;br /&gt;
** 返回结果是网状的蛋白质互作消息&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质多序列比对 ===&lt;br /&gt;
多序列比对MSA是指把多条（3 条或以上）有系统进化关系的蛋白质分子的氨基酸序列或核酸序列进行比对，尽可能地把相同的碱基或氨基酸残基排在同一列上。对齐的碱基或氨基酸残基在进化上是同源的，即来自共同祖先。&lt;br /&gt;
&lt;br /&gt;
序列比对主要是为了寻找相似的序列，相似的序列往往起源于一个共同的祖先序列，它们很可能有相似的空间结构和生物学功能，有利于推测这个未知结构和功能的蛋白质的结构和功能。&lt;br /&gt;
&lt;br /&gt;
* Tcoffee核酸和蛋白质都可以&lt;br /&gt;
** 基本原理是首先构建一个包含有clustalw得到的序列两两比对和fasta得到的局部两两比对数据的库,并且给每个比对一个权重.然后把结果进行整合,最后是progressive比对过程.&lt;br /&gt;
** Rcoffee可以根据预测的RNA二级结构对比序列&lt;br /&gt;
* ClustralW有快慢两种模式，&lt;br /&gt;
** 原理是两两比对-&amp;gt;两两之间距离矩阵-&amp;gt;NJ建Binary进化树作为guidetree-&amp;gt;用progressive的方法添加序列到树上直到比对完成&lt;br /&gt;
** 有Accurate慢和Appropriate快两种模式，Accruate比Tcoffee快，Appropriate比Muscle慢&lt;br /&gt;
* Muscle&lt;br /&gt;
** 它之所以比clustalw快一方面是因为没有进行两两序列比对,用序列间共有的word数表征序列间的相似性;另一方面用UPGMA代替NJ构建guide tree. 如果没有对于结果的refinement过程,时间更短,时间复杂度为O(NL^2),也就是说时间和序列数成线性关系.&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质数据质量评估 ===&lt;br /&gt;
&lt;br /&gt;
* PROCHECK&lt;br /&gt;
** 在对蛋白的二级结构进行评估之时,一个重要的指标就是二面角φ, ψ是否在合理范围之内, 其中φ代表 α 碳原子和氮原子间的键的旋转度phi, ψ代表α碳原子和羰基碳原子间的键的旋转度。PROCHECK可以计算给定PDB文件的所有φ, ψ二面角, 然后给出总的评估结果,并将结果绘制成Ramachandran图表示。&lt;br /&gt;
** 不少于90%的二面角分布在图中的合理(蓝色)区域，则蛋白结构合理&lt;br /&gt;
* VERIFY_3D&lt;br /&gt;
** 对同源建模所得模型的质量进行了可视化分析，用来判断模型与氨基酸序列之间的兼容性。&lt;br /&gt;
** 对氨基酸残基数大于100的蛋白质，VERIFY_3D的评估结果更准确。&lt;br /&gt;
** 当不低于80%的氨基酸残基得分大 0.2时，即可认为目的蛋白建模所得模型属于高质量的模型结构。&lt;br /&gt;
* [https://proq.bioinfo.se/ProQ/ProQ.html ProQ - 蛋白质质量评价]&amp;lt;这个没找到总结&amp;gt; ProQ 是一种基于神经网络的预测器，它基于许多 结构特征可预测蛋白质模型的质量。ProQ 是 优化以找到正确的模型，与其他方法相比 经过优化以查找原生结构。两个质量衡量标准是 预测 LGscore 和 MaxSub。  LGscore 是 P 值的 -log，MaxSub 范围为 0-1，其中 0 为 微不足道和 1 个非常显著。&lt;br /&gt;
&lt;br /&gt;
=== 跨膜序列预测 ===&lt;br /&gt;
&lt;br /&gt;
* TMHMM由丹麦的CBS维护，使用隐马尔可夫模型预测跨膜蛋白序列&lt;br /&gt;
&lt;br /&gt;
* TMpred预测蛋白质的跨膜结构域（TMDs），基于氨基酸疏水性分析。输入蛋白质序列，输出跨膜区的位置、与拓扑结构（膜内/膜外方向）&lt;br /&gt;
&lt;br /&gt;
=== 信号肽SignalP ===&lt;br /&gt;
&lt;br /&gt;
* 预测蛋白质的 信号肽及其切割位点，判断是否为分泌蛋白或膜蛋白。&lt;br /&gt;
* &#039;&#039;&#039;输入&#039;&#039;&#039;：蛋白质序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：信号肽位置、切割位点概率、分泌类型（Sec/SPI/Tat）。&lt;br /&gt;
&lt;br /&gt;
=== 调控元件与内含子/外显子 ===&lt;br /&gt;
&lt;br /&gt;
* PLACE&#039;&#039;&#039;植物顺式作用元件数据库&#039;&#039;&#039;（Plant Cis-Acting Regulatory DNA Elements），存储植物启动子区域的功能性调控元件。&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：DNA序列（如启动子区域）。&#039;&#039;&#039;输出&#039;&#039;&#039;：匹配的调控元件名称、位置及功能注释。&lt;br /&gt;
* Augustus真核生物基因结构预测&lt;br /&gt;
** 基于隐马尔可夫模型（HMM）和物种特异性训练数据预测基因结构。&lt;br /&gt;
*** 可以直接预测训练之后的物种。若不存在被训练过的物种，需要[https://www.jianshu.com/p/6f7b2998600c 准备训练集和测试集进行训练]  可靠的基因结构序列的要求如下： 之后随机将注释数据集分成训练集和测试集，测试集要足够多的基因（100~200个），并且要足够的随机。  a. 提供基因的编码部分，包含上游几KB。通常，基因越多越好。还得保证有足够多的外显子，这样子才能训练内含子  b. 这些基因的基因结构一定足够准确。不过，也不需要百分百正确，只要保证起始密码子和终止密码子是准确的。  c. 需要保证这些基因没有冗余，不同序列如果有几乎相同的注释后氨基酸序列，那么仅仅取其中一个  d. 一条序列允许有多个基因，基因可以在正链也可以在负链，但是这些基因间不能有重叠，每个基因只要其中一个转录本，存放格式是GenBank&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：基因组DNA序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：预测的基因模型（外显子、内含子、CDS区域）、蛋白质序列。&lt;br /&gt;
* ORFfinder&lt;br /&gt;
** 识别DNA序列中的 开放阅读框ORF，基于遗传密码表扫描可能的编码区域。&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：DNA序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：ORF的位置、长度、翻译的氨基酸序列。&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质物理特性识别 ===&lt;br /&gt;
Compute pI/Mw&lt;br /&gt;
&lt;br /&gt;
* 计算蛋白质的 &#039;&#039;&#039;等电点（pI） 和 分子量（Mw）&#039;&#039;&#039;，基于氨基酸序列的电荷分布和组成。&lt;br /&gt;
* &#039;&#039;&#039;输入&#039;&#039;&#039;：蛋白质氨基酸序列（FASTA格式）。&#039;&#039;&#039;输出&#039;&#039;&#039;：pI和Mw的数值结果。&lt;br /&gt;
ExPasy的protogram数据库亦有记载&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质修饰预测 ===&lt;br /&gt;
NMT蛋白质甲基化预测&lt;br /&gt;
&lt;br /&gt;
NetPho蛋白质磷酸化预测&lt;br /&gt;
&lt;br /&gt;
NetAcet蛋白质乙酰化&lt;br /&gt;
&lt;br /&gt;
=== 基因比对 ===&lt;br /&gt;
BWA-MEM自动选择全局/局部算法，长序列更适合&lt;br /&gt;
&lt;br /&gt;
SOAP快，短序列更加合适&lt;br /&gt;
&lt;br /&gt;
NovoAlign慢而准确&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4916</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4916"/>
		<updated>2025-03-17T11:38:45Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心） */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
国际核苷酸序列数据库协作 （INSDC），包含NLM-NCBI(美国）,ENA(欧洲,EMBL与EBI参与),DDBJ(日本),&lt;br /&gt;
&lt;br /&gt;
其创始成员是信息和系统研究组织、日本国家遗传学研究所 （ROIS-NIG）、欧洲分子生物学实验室 - 欧洲生物信息学研究所 （EMBL-EBI） 和美国国立卫生研究院的一个组成部分,国家医学图书馆-国家生物技术信息中心 （NLM-NCBI）。&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
PubMed诞生于1996年。最常用的文摘型数据库。其收录范围不仅包括Medline，还有大部分PMC和NIH基金资助作者的文献，NCBI书籍等。PubMed还提供链接到文献全文所在网站的全文链接。早期 PubMed 数据库主要的任务，是将 Mesh 目录(MEDlINE的早期目录，主题词表)中收录的医学主题与大量有关医学研究的文献相匹配。这意味着，PubMed最早的发布时间应该是在 1971 年，也就是 MEDLINE 数据库第一次正式发布的时间。&lt;br /&gt;
&lt;br /&gt;
MEDLINE始建于1966年（追溯收录至1946年），是NLM的期刊文献记录数据库。1983年，MEDLINE推出电子版，网上数据每日更新，光盘版每月更新。MEDLINE有严格的文献选择委员会LSTRC进行选刊。目前MEDLINE的文献都收录在PubMed中。&lt;br /&gt;
&lt;br /&gt;
PMC全称为PubMed Central，建立于2000年，由NCBI进行管理，是可以免费获取全文的生物医学和生命科学全文数据库，保存了NLM收录印刷杂志的电子副本。PMC的部分bookreview内容没有收录于PubMed。&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签数据库，由NCBI维护&lt;br /&gt;
** ESTs是从不同生物体中提取的短序列片段，通常是基因的转录产物。这些ESTs是通过cDNA文库构建和测序获得的，可以提供有关特定基因的信息。ESTs的测序往往是高通量的，可以快速识别和记录大量的基因序列。&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
** psi-BLAST用位置特异权重矩阵搜索，适合远缘物种相似蛋白/家族新蛋白&lt;br /&gt;
** phi-BLAST模式发现迭代BLAST，仅输出序列中含有特殊模式的对齐&lt;br /&gt;
*** 精准度phiBLAST&amp;gt;BLASTp&amp;gt;psiBLAST,范围psiBLAST&amp;gt;BLASTp&amp;gt;phiBLAST&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== EMBL（European Molecular Biology Laboratory）欧洲分子生物学实验室 ==&lt;br /&gt;
总部位于德国海德堡，1974年由欧洲14个国家加上亚洲的以色列共同发起建立，现在由欧洲29个成员国政府支持组成，目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。&lt;br /&gt;
&lt;br /&gt;
[https://www.embl.org www.embl.org]&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成.2002 年，PIR 与其国际合作伙伴 EBI（欧洲生物信息学研究所）和 SIB（瑞士生物信息学研究所）一起获得了 NIH 的资助，创建了 UniProt。 通过统一 PIR-PSD、Swiss-Prot 和 TrEMBL 数据库，实现蛋白质序列和功能的单一全球数据库。&lt;br /&gt;
* Uniprot提供亚细胞定位，翻译后修饰&lt;br /&gt;
* Uniprot是包含蛋白质序列，功能信息，论文索引的蛋白质数据库，整合了包括EBI,SIB,PIR三大数据库的资源。&lt;br /&gt;
**EMBL-EBI是指欧洲生物信息学研究所（European Bioinformatics Institute），EMBL的一部分。1982年建立了先进的核苷酸序列数据库（EMBL-DNA），可进行核苷酸序列检索及序列相似性查询。TrEMBL&lt;br /&gt;
**SIB,瑞士生物信息学研究所，维护着ExPASy的服务器,Swissprot&lt;br /&gt;
*** &#039;&#039;&#039;ExPASy&#039;&#039;&#039;是一个集成了多种生物信息学工具和数据库的平台，专门用于蛋白质和蛋白质组学的研究。除了蛋白质相关的数据外，ExPASy还提供了其他生物信息学资源，如代谢通路数据库（KEGG京都代谢通路基因什么什么库）等。其中，Protparam工具是经常使用的功能，它可以根据蛋白质序列估计蛋白质的等电点（pi）、疏水性等特性。&lt;br /&gt;
**** Protscale判断蛋白质序列的疏水性，返回的结果是疏水性曲线，亲水用负值表示,疏水用正值表示。原理是滑动窗口&lt;br /&gt;
**** Prosite数据库是一个用于存储和提供蛋白质序列和结构特征的资源。 主要功能是提供蛋白质的功能和结构信息可以识别功能域和模式，可用于蛋白质家族和亲缘关系的研究，预测蛋白质结构与功能&lt;br /&gt;
** PIR &#039;&#039;&#039;Protein information resource&#039;&#039;&#039;，由美国国家生物医学研究基金会（NBRF）于1984年成立,用于支持基因组学、蛋白质组学和系统生物学研究和科学研究。提供蛋白质数据库和分析工具，包括蛋白质序列数据库 （PSD）。PIR-PSD&lt;br /&gt;
*数据库的关系&lt;br /&gt;
通过INSDC等得到原始数据，处理后存入UniParc。&lt;br /&gt;
&lt;br /&gt;
UniParc作为数据仓库，再分别给UniProtKB，Proteomes，UniRef提供可靠的数据集。&lt;br /&gt;
这里的UniProtKB 由两个子库构成 Swiss-Prot，TrEMBL。&lt;br /&gt;
&lt;br /&gt;
Swiss-Prot 经过人工验证和注释，是高质量的蛋白质注释数据。但人工效率在高速增长的蛋白质数据面前显得极其低效。因此，注释这些数据需要大量时间，为了弥补这一问题。TrEMBL 被建立用于存储由机器自动翻译和预测的蛋白质序列。导致蛋白质数据冗余↑可信度↓。&lt;br /&gt;
&lt;br /&gt;
简而言之，在UniProtKB数据库中Swiss-Prot是由TrEMBL经过手动注释后得到的高质量非冗余数据库，也是我们今后常用的蛋白质数据库之一。&lt;br /&gt;
&lt;br /&gt;
[https://zhuanlan.zhihu.com/p/599641613 感谢知乎qwq]&lt;br /&gt;
&lt;br /&gt;
*Uniprot内部有UniPrac，Uniref，UniProtKB三层，由粗糙到精细列&lt;br /&gt;
** 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。UniParc由于数据冗余，将相同序列合并一条，唯一编号。&lt;br /&gt;
** 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
** 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&amp;lt;TrEMBL和Swissprot热血沸腾的组合技&amp;gt;&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&lt;br /&gt;
== 蛋白质结构数据库 ==&lt;br /&gt;
&lt;br /&gt;
=== 一级结构数据库 ===&lt;br /&gt;
PDB蛋白质结构数据库(Protein Data Bank)是美国Brookhaven国家实验室于1971年创建的，由结构生物信息学研究合作组织(RCSB)维护。&lt;br /&gt;
* PDB数据库以文本文件形式存储分子数据，每个分子形用一个独立的文件。早期的分子文件的文件名后缀为“.pdb”，1997年以后每1种生物大分子对应1组(3个)相关文件分别是：全文文件(后缀为“.full”相当于原来的“.pdb”文件)、书目文件(后缀为“.biblio”)和图形文件(后缀为“.gif”)。&lt;br /&gt;
* PDB数据库是生物大分子的原子坐标和描述蛋白质和其他重要生物大分子相关信息的存储库。结构生物学家使用x 射线晶体学、核磁共振光谱和冷冻电子显微镜等方法来确定分子中每个原子相对于彼此的位置，然后存储这些信息，并由PDB数据库注释并公开发布到档案中。&lt;br /&gt;
**[https://zhuanlan.zhihu.com/p/589697113/]&lt;br /&gt;
[https://www.rcsb.org/]&lt;br /&gt;
&lt;br /&gt;
=== 二级结构数据库 ===&lt;br /&gt;
DSSP工具：DSSP程序是一个二级结构分配（以及更多信息）的数据库，涵盖PDB中的所有蛋白质条目。DSSP也是从PDB条目计算DSSP条目的程序。DSSP并不预测二级结构。&lt;br /&gt;
&lt;br /&gt;
* 根据氢键模式和主链构象，将蛋白质的每个残基分类为特定的二级结构类型。算残基之间的氢键能量，用于确定二级结构的边界。计算每个残基的溶剂可及表面积（ASA），反映其在蛋白质表面的暴露程度。&lt;br /&gt;
* 输入：蛋白质的三维结构文件（通常为PDB格式）。输出：包含每个残基的二级结构类型、氢键信息、溶剂可及性等数据的文本文件。&lt;br /&gt;
&lt;br /&gt;
Pfam数据库重视&#039;&#039;&#039;蛋白质结构域和家族&#039;&#039;&#039;（基于序列同源性）分为Pfam-A和Pfam-B。。Pfam数据库主要用于蛋白质家族的分类和功能注释。&lt;br /&gt;
&lt;br /&gt;
* Pfam-A是手工整理的高质量家族集合，&lt;br /&gt;
* Pfam-B是自动生成的家族集合，具有更广泛但相对较低的准确性&lt;br /&gt;
&lt;br /&gt;
* 关注功能相关的蛋白质区域（如结构域），而非完整蛋白质的结构。&lt;br /&gt;
&lt;br /&gt;
* 分类依据：&lt;br /&gt;
** &#039;&#039;&#039;序列相似性&#039;&#039;&#039;，通过隐马尔可夫模型（HMM）比对识别保守区域。&lt;br /&gt;
** 基于多序列比对和进化关系。&lt;br /&gt;
&lt;br /&gt;
* 层次结构：&lt;br /&gt;
** 超家族（Clan）：多个家族在进化或功能上的关联。&lt;br /&gt;
** 家族（Family）：具有显著序列相似性的结构域集合&lt;br /&gt;
* Pfam的链接都已经重新定位到Interpro了,也是EMBL-EBI生的&lt;br /&gt;
&lt;br /&gt;
CATH数据库提供蛋白质三维结构与分类，关注&#039;&#039;&#039;结构的拓扑和进化起源&#039;&#039;&#039;。&lt;br /&gt;
&lt;br /&gt;
* 蛋白质三维结构的层次化分类（从二级结构到进化关系）以三维结构特征为依据，结合序列和功能信息进行分类&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构组成（如全α、全β、α+β、α/β）。&lt;br /&gt;
*# Architecture（架构）：描述二级结构的空间排布（如β桶、α螺旋束）。&lt;br /&gt;
*# Topology（拓扑）：基于折叠方式和连接性。&lt;br /&gt;
*# Homologous Superfamily&#039;&#039;&#039;（&#039;&#039;&#039;同源超家族）：进化相关的蛋白质。&lt;br /&gt;
&lt;br /&gt;
SCOP数据库分类强调进化同源性，基于结构与进化关系分类，由&#039;&#039;&#039;专家手动分类，强调超家族内的远缘同源关系。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构类型（如全α、全β等）。&lt;br /&gt;
*# Fold（折叠方式）：具有相似拓扑结构的蛋白质。&lt;br /&gt;
*# Superfamily（超家族）：推测具有共同祖先的结构相似蛋白质。&lt;br /&gt;
*# Family（家族）：明确序列同源性的蛋白质集合。&lt;br /&gt;
&lt;br /&gt;
* SCOPe引入自动化分类，但核心仍保留手动注释。&lt;br /&gt;
&amp;lt;这段deepseek写的，我对着笔记查了一下&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== 搞人小数据库，考了之后就把名字全记下来了 ==&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质三级结构预测 ===&lt;br /&gt;
* I-TASSER穿线法预测：有相似才能用从PDB中识别结构模板，并通过基于迭代模板的碎片组装模拟构建完整的原子模型(将蛋白质“穿入”已有的蛋白质结构模板)。 接着通过蛋白质功能数据库BioLiP对3D模型进行重新线程化，从而预测功能。&lt;br /&gt;
** 有人把ITASSER归进从头建模了&lt;br /&gt;
&lt;br /&gt;
* Swissmodel同源建模：按照FASTA格式输入氨基酸序列，要有相似度&amp;gt;30%的蛋白质模板&lt;br /&gt;
** 同源建模也称为比较建模，根据与已知结构的序列同源性预测蛋白质结构。基于“如果两个蛋白质具有足够高的序列相似性，它们很可能具有非常相似的三维结构”的原理。如果蛋白质序列之一具有已知结构，则可以以高置信度将该结构复制/映射到未知蛋白质。&lt;br /&gt;
** 质量评估：其中相似度值，即序列同源性经比对后结果在 40% 以上，则待预测蛋白与模板蛋白结构大概为同源蛋白，则同源建模方法可用于预测该蛋白三维结构。根据GMQE值及ＱＭEAN值评价结果，都是全局比对。&lt;br /&gt;
*** GMQE值在0－1之间，越接近１则建模质量越好&lt;br /&gt;
*** QMEAN值关于覆盖率区间为－４－０，越接近０则匹配度越好。&lt;br /&gt;
** 此功能在Modelle(蛋白质复合体同源建模)与Discovery Studio与AlphaFold-Multimer亦有记载&lt;br /&gt;
* QUARK从头计算：从头经历复杂的算法归纳到能量最低，此事在Alphafold亦有记载&lt;br /&gt;
* Rosetta综合以上算法，但亦有说同源建模的&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质功能与结构域数据库&amp;amp;预测 ===&lt;br /&gt;
&lt;br /&gt;
* InterPro是集成的蛋白质结构域和功能位点数据库，包含关于蛋白质家族、域、重复序列、和作用位点等数据资源。InterPro通过将蛋白质分类为家族并预测结构域和重要位点来提供蛋白质的功能分析。为了以这种方式对蛋白质进行分类，InterPro 使用由组成 InterPro 联盟的多个不同数据库（称为成员数据库）提供的预测模型（称为特征）。&lt;br /&gt;
** InterPro包含很多来自不同数据库的人工注释文件，形成了一个给定的蛋白质家族、结构域和功能位点的独特描述。&lt;br /&gt;
** Interpro数据库成员包括Coils 、Gene3D、Pfam、PRINTS、ProSitePatterns、ProSiteProfiles、SMART、SUPERFAMILY、 TIGRFAM、ProDom、PIR 数据库，每两个月更新一次&lt;br /&gt;
** EBI生的，可能假阳性&lt;br /&gt;
* Pfam数据库是一个庞大的蛋白质家族集合，每个家族都由多个序列比对和隐马尔可夫模型（HMMs）表示&lt;br /&gt;
* SMART 是一个用于蛋白质结构域鉴定、注释的在线分析工具。它的数据与UniProt、Ensembl和STRING数据库同步&lt;br /&gt;
** 您可以在两种不同的模式下使用 SMART：&#039;&#039;&#039;正常&#039;&#039;&#039;模式或&#039;&#039;&#039;基因组&#039;&#039;&#039;模式。主要区别在于所使用的基础蛋白质数据库。&lt;br /&gt;
** 在 &#039;&#039;&#039;Normal SMART&#039;&#039;&#039; 中，数据库包含 Swiss-Prot、SP-TrEMBL 和稳定的 Ensembl 蛋白质组。即使删除了相同的蛋白质，Normal SMART 中的蛋白质数据库具有显著的冗余性，&lt;br /&gt;
** 在 &#039;&#039;&#039;Genomic SMART&#039;&#039;&#039; 中，仅使用完全测序基因组的蛋白质组;后生动物的 Ensembl 和其余的 Swiss-Prot。如果您使用 SMART 来探索结构域架构，或者想要在各种基因组中查找确切的结构域计数，请考虑切换到&#039;&#039;&#039;基因组&#039;&#039;&#039;模式。结构域标注页中的数字会更准确，架构查询结果中不会有很多对应同一个基因的蛋白片段。&lt;br /&gt;
&lt;br /&gt;
=== 蛋白相互作用库 ===&lt;br /&gt;
&lt;br /&gt;
* DIP&amp;lt;sup&amp;gt;TM&amp;lt;/sup&amp;gt; 数据库对实验确定的蛋白质之间的相互作用进行了编目。它结合了来自各种来源的信息，以创建一组单一、一致的蛋白质-蛋白质相互作用。存储在 DIP 数据库中的数据既由专家策展人手动管理，也使用计算方法自动管理&lt;br /&gt;
* BioGRID(Biological General Repository for Interaction Datasets)数据库 生物相互作用网络，是由大量单个蛋白质或遗传相互作用以及RNA，DNA，膜，碳水化合物和小分子代谢物的相互作用聚集形成的，BioGRID致力于所有主要模式生物物种和人类的蛋白质，遗传和药物相互作用的管理和存[https://www.jianshu.com/p/63a5834c2fe9 储]&lt;br /&gt;
** 合并了DrugBank中的化学-蛋白质相互作用记录&lt;br /&gt;
** 为了协调和统一不同模式生物研究中使用的各种遗传相互作用术语，BioGRID与WormBase([https://wormbase.org/#012-34-5 线虫数据库])合作开发了新的标准化遗传相互作用结构术语或GIST。GIST已设计为使用通用遗传相互作用术语精确指定遗传相互作用&lt;br /&gt;
** BioGRID ORCS：用于CRISPR筛选数据的存储单元&lt;br /&gt;
* STRING功能性蛋白质关联网络。收集多个公共数据库，包括UniProt、KEGG、NCBI和Gene Ontology整合并生成一个全面的蛋白质相互作用网络数据库。&lt;br /&gt;
** 返回结果是网状的蛋白质互作消息&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质多序列比对 ===&lt;br /&gt;
多序列比对MSA是指把多条（3 条或以上）有系统进化关系的蛋白质分子的氨基酸序列或核酸序列进行比对，尽可能地把相同的碱基或氨基酸残基排在同一列上。对齐的碱基或氨基酸残基在进化上是同源的，即来自共同祖先。&lt;br /&gt;
&lt;br /&gt;
序列比对主要是为了寻找相似的序列，相似的序列往往起源于一个共同的祖先序列，它们很可能有相似的空间结构和生物学功能，有利于推测这个未知结构和功能的蛋白质的结构和功能。&lt;br /&gt;
&lt;br /&gt;
* Tcoffee核酸和蛋白质都可以&lt;br /&gt;
** 基本原理是首先构建一个包含有clustalw得到的序列两两比对和fasta得到的局部两两比对数据的库,并且给每个比对一个权重.然后把结果进行整合,最后是progressive比对过程.&lt;br /&gt;
** Rcoffee可以根据预测的RNA二级结构对比序列&lt;br /&gt;
* ClustralW有快慢两种模式，&lt;br /&gt;
** 原理是两两比对-&amp;gt;两两之间距离矩阵-&amp;gt;NJ建Binary进化树作为guidetree-&amp;gt;用progressive的方法添加序列到树上直到比对完成&lt;br /&gt;
** 有Accurate慢和Appropriate快两种模式，Accruate比Tcoffee快，Appropriate比Muscle慢&lt;br /&gt;
* Muscle&lt;br /&gt;
** 它之所以比clustalw快一方面是因为没有进行两两序列比对,用序列间共有的word数表征序列间的相似性;另一方面用UPGMA代替NJ构建guide tree. 如果没有对于结果的refinement过程,时间更短,时间复杂度为O(NL^2),也就是说时间和序列数成线性关系.&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质数据质量评估 ===&lt;br /&gt;
&lt;br /&gt;
* PROCHECK&lt;br /&gt;
** 在对蛋白的二级结构进行评估之时,一个重要的指标就是二面角φ, ψ是否在合理范围之内, 其中φ代表 α 碳原子和氮原子间的键的旋转度phi, ψ代表α碳原子和羰基碳原子间的键的旋转度。PROCHECK可以计算给定PDB文件的所有φ, ψ二面角, 然后给出总的评估结果,并将结果绘制成Ramachandran图表示。&lt;br /&gt;
** 不少于90%的二面角分布在图中的合理(蓝色)区域，则蛋白结构合理&lt;br /&gt;
* VERIFY_3D&lt;br /&gt;
** 对同源建模所得模型的质量进行了可视化分析，用来判断模型与氨基酸序列之间的兼容性。&lt;br /&gt;
** 对氨基酸残基数大于100的蛋白质，VERIFY_3D的评估结果更准确。&lt;br /&gt;
** 当不低于80%的氨基酸残基得分大 0.2时，即可认为目的蛋白建模所得模型属于高质量的模型结构。&lt;br /&gt;
* [https://proq.bioinfo.se/ProQ/ProQ.html ProQ - 蛋白质质量评价]&amp;lt;这个没找到总结&amp;gt; ProQ 是一种基于神经网络的预测器，它基于许多 结构特征可预测蛋白质模型的质量。ProQ 是 优化以找到正确的模型，与其他方法相比 经过优化以查找原生结构。两个质量衡量标准是 预测 LGscore 和 MaxSub。  LGscore 是 P 值的 -log，MaxSub 范围为 0-1，其中 0 为 微不足道和 1 个非常显著。&lt;br /&gt;
&lt;br /&gt;
=== 跨膜序列预测 ===&lt;br /&gt;
&lt;br /&gt;
* TMHMM由丹麦的CBS维护，使用隐马尔可夫模型预测跨膜蛋白序列&lt;br /&gt;
&lt;br /&gt;
* TMpred预测蛋白质的跨膜结构域（TMDs），基于氨基酸疏水性分析。输入蛋白质序列，输出跨膜区的位置、与拓扑结构（膜内/膜外方向）&lt;br /&gt;
&lt;br /&gt;
=== 信号肽SignalP ===&lt;br /&gt;
&lt;br /&gt;
* 预测蛋白质的 信号肽及其切割位点，判断是否为分泌蛋白或膜蛋白。&lt;br /&gt;
* &#039;&#039;&#039;输入&#039;&#039;&#039;：蛋白质序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：信号肽位置、切割位点概率、分泌类型（Sec/SPI/Tat）。&lt;br /&gt;
&lt;br /&gt;
=== 调控元件与内含子/外显子 ===&lt;br /&gt;
&lt;br /&gt;
* PLACE&#039;&#039;&#039;植物顺式作用元件数据库&#039;&#039;&#039;（Plant Cis-Acting Regulatory DNA Elements），存储植物启动子区域的功能性调控元件。&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：DNA序列（如启动子区域）。&#039;&#039;&#039;输出&#039;&#039;&#039;：匹配的调控元件名称、位置及功能注释。&lt;br /&gt;
* Augustus真核生物基因结构预测&lt;br /&gt;
** 基于隐马尔可夫模型（HMM）和物种特异性训练数据预测基因结构。&lt;br /&gt;
*** 可以直接预测训练之后的物种。若不存在被训练过的物种，需要[https://www.jianshu.com/p/6f7b2998600c 准备训练集和测试集进行训练]  可靠的基因结构序列的要求如下： 之后随机将注释数据集分成训练集和测试集，测试集要足够多的基因（100~200个），并且要足够的随机。  a. 提供基因的编码部分，包含上游几KB。通常，基因越多越好。还得保证有足够多的外显子，这样子才能训练内含子  b. 这些基因的基因结构一定足够准确。不过，也不需要百分百正确，只要保证起始密码子和终止密码子是准确的。  c. 需要保证这些基因没有冗余，不同序列如果有几乎相同的注释后氨基酸序列，那么仅仅取其中一个  d. 一条序列允许有多个基因，基因可以在正链也可以在负链，但是这些基因间不能有重叠，每个基因只要其中一个转录本，存放格式是GenBank&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：基因组DNA序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：预测的基因模型（外显子、内含子、CDS区域）、蛋白质序列。&lt;br /&gt;
* ORFfinder&lt;br /&gt;
** 识别DNA序列中的 开放阅读框ORF，基于遗传密码表扫描可能的编码区域。&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：DNA序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：ORF的位置、长度、翻译的氨基酸序列。&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质物理特性识别 ===&lt;br /&gt;
Compute pI/Mw&lt;br /&gt;
&lt;br /&gt;
* 计算蛋白质的 &#039;&#039;&#039;等电点（pI） 和 分子量（Mw）&#039;&#039;&#039;，基于氨基酸序列的电荷分布和组成。&lt;br /&gt;
* &#039;&#039;&#039;输入&#039;&#039;&#039;：蛋白质氨基酸序列（FASTA格式）。&#039;&#039;&#039;输出&#039;&#039;&#039;：pI和Mw的数值结果。&lt;br /&gt;
ExPasy的protogram数据库亦有记载&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4901</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4901"/>
		<updated>2025-03-17T04:59:10Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* 搞人小数据库，考了之后就把名字全记下来了 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
国际核苷酸序列数据库协作 （INSDC），包含NLM-NCBI(美国）,ENA(欧洲,EMBL与EBI参与),DDBJ(日本),&lt;br /&gt;
&lt;br /&gt;
其创始成员是信息和系统研究组织、日本国家遗传学研究所 （ROIS-NIG）、欧洲分子生物学实验室 - 欧洲生物信息学研究所 （EMBL-EBI） 和美国国立卫生研究院的一个组成部分,国家医学图书馆-国家生物技术信息中心 （NLM-NCBI）。&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
PubMed诞生于1996年。最常用的文摘型数据库。其收录范围不仅包括Medline，还有大部分PMC和NIH基金资助作者的文献，NCBI书籍等。PubMed还提供链接到文献全文所在网站的全文链接。早期 PubMed 数据库主要的任务，是将 Mesh 目录(MEDlINE的早期目录，主题词表)中收录的医学主题与大量有关医学研究的文献相匹配。这意味着，PubMed最早的发布时间应该是在 1971 年，也就是 MEDLINE 数据库第一次正式发布的时间。&lt;br /&gt;
&lt;br /&gt;
MEDLINE始建于1966年（追溯收录至1946年），是NLM的期刊文献记录数据库。1983年，MEDLINE推出电子版，网上数据每日更新，光盘版每月更新。MEDLINE有严格的文献选择委员会LSTRC进行选刊。目前MEDLINE的文献都收录在PubMed中。&lt;br /&gt;
&lt;br /&gt;
PMC全称为PubMed Central，建立于2000年，由NCBI进行管理，是可以免费获取全文的生物医学和生命科学全文数据库，保存了NLM收录印刷杂志的电子副本。PMC的部分bookreview内容没有收录于PubMed。&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签数据库，由NCBI维护&lt;br /&gt;
** ESTs是从不同生物体中提取的短序列片段，通常是基因的转录产物。这些ESTs是通过cDNA文库构建和测序获得的，可以提供有关特定基因的信息。ESTs的测序往往是高通量的，可以快速识别和记录大量的基因序列。&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== EMBL（European Molecular Biology Laboratory）欧洲分子生物学实验室 ==&lt;br /&gt;
总部位于德国海德堡，1974年由欧洲14个国家加上亚洲的以色列共同发起建立，现在由欧洲29个成员国政府支持组成，目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。&lt;br /&gt;
&lt;br /&gt;
[https://www.embl.org www.embl.org]&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成.2002 年，PIR 与其国际合作伙伴 EBI（欧洲生物信息学研究所）和 SIB（瑞士生物信息学研究所）一起获得了 NIH 的资助，创建了 UniProt。 通过统一 PIR-PSD、Swiss-Prot 和 TrEMBL 数据库，实现蛋白质序列和功能的单一全球数据库。&lt;br /&gt;
* Uniprot提供亚细胞定位，翻译后修饰&lt;br /&gt;
* Uniprot是包含蛋白质序列，功能信息，论文索引的蛋白质数据库，整合了包括EBI,SIB,PIR三大数据库的资源。&lt;br /&gt;
**EMBL-EBI是指欧洲生物信息学研究所（European Bioinformatics Institute），EMBL的一部分。1982年建立了先进的核苷酸序列数据库（EMBL-DNA），可进行核苷酸序列检索及序列相似性查询。TrEMBL&lt;br /&gt;
**SIB,瑞士生物信息学研究所，维护着ExPASy的服务器,Swissprot&lt;br /&gt;
*** &#039;&#039;&#039;ExPASy&#039;&#039;&#039;是一个集成了多种生物信息学工具和数据库的平台，专门用于蛋白质和蛋白质组学的研究。除了蛋白质相关的数据外，ExPASy还提供了其他生物信息学资源，如代谢通路数据库（KEGG京都代谢通路基因什么什么库）等。其中，Protparam工具是经常使用的功能，它可以根据蛋白质序列估计蛋白质的等电点（pi）、疏水性等特性。&lt;br /&gt;
**** Protscale判断蛋白质序列的疏水性，返回的结果是疏水性曲线，亲水用负值表示,疏水用正值表示。原理是滑动窗口&lt;br /&gt;
**** Prosite数据库是一个用于存储和提供蛋白质序列和结构特征的资源。 主要功能是提供蛋白质的功能和结构信息可以识别功能域和模式，可用于蛋白质家族和亲缘关系的研究，预测蛋白质结构与功能&lt;br /&gt;
** PIR &#039;&#039;&#039;Protein information resource&#039;&#039;&#039;，由美国国家生物医学研究基金会（NBRF）于1984年成立,用于支持基因组学、蛋白质组学和系统生物学研究和科学研究。提供蛋白质数据库和分析工具，包括蛋白质序列数据库 （PSD）。PIR-PSD&lt;br /&gt;
*数据库的关系&lt;br /&gt;
通过INSDC等得到原始数据，处理后存入UniParc。&lt;br /&gt;
&lt;br /&gt;
UniParc作为数据仓库，再分别给UniProtKB，Proteomes，UniRef提供可靠的数据集。&lt;br /&gt;
这里的UniProtKB 由两个子库构成 Swiss-Prot，TrEMBL。&lt;br /&gt;
&lt;br /&gt;
Swiss-Prot 经过人工验证和注释，是高质量的蛋白质注释数据。但人工效率在高速增长的蛋白质数据面前显得极其低效。因此，注释这些数据需要大量时间，为了弥补这一问题。TrEMBL 被建立用于存储由机器自动翻译和预测的蛋白质序列。导致蛋白质数据冗余↑可信度↓。&lt;br /&gt;
&lt;br /&gt;
简而言之，在UniProtKB数据库中Swiss-Prot是由TrEMBL经过手动注释后得到的高质量非冗余数据库，也是我们今后常用的蛋白质数据库之一。&lt;br /&gt;
&lt;br /&gt;
[https://zhuanlan.zhihu.com/p/599641613 感谢知乎qwq]&lt;br /&gt;
&lt;br /&gt;
*Uniprot内部有UniPrac，Uniref，UniProtKB三层，由粗糙到精细列&lt;br /&gt;
** 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。UniParc由于数据冗余，将相同序列合并一条，唯一编号。&lt;br /&gt;
** 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
** 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&amp;lt;TrEMBL和Swissprot热血沸腾的组合技&amp;gt;&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&lt;br /&gt;
== 蛋白质结构数据库 ==&lt;br /&gt;
&lt;br /&gt;
=== 一级结构数据库 ===&lt;br /&gt;
PDB蛋白质结构数据库(Protein Data Bank)是美国Brookhaven国家实验室于1971年创建的，由结构生物信息学研究合作组织(RCSB)维护。&lt;br /&gt;
* PDB数据库以文本文件形式存储分子数据，每个分子形用一个独立的文件。早期的分子文件的文件名后缀为“.pdb”，1997年以后每1种生物大分子对应1组(3个)相关文件分别是：全文文件(后缀为“.full”相当于原来的“.pdb”文件)、书目文件(后缀为“.biblio”)和图形文件(后缀为“.gif”)。&lt;br /&gt;
* PDB数据库是生物大分子的原子坐标和描述蛋白质和其他重要生物大分子相关信息的存储库。结构生物学家使用x 射线晶体学、核磁共振光谱和冷冻电子显微镜等方法来确定分子中每个原子相对于彼此的位置，然后存储这些信息，并由PDB数据库注释并公开发布到档案中。&lt;br /&gt;
**[https://zhuanlan.zhihu.com/p/589697113/]&lt;br /&gt;
[https://www.rcsb.org/]&lt;br /&gt;
&lt;br /&gt;
=== 二级结构数据库 ===&lt;br /&gt;
DSSP工具：DSSP程序是一个二级结构分配（以及更多信息）的数据库，涵盖PDB中的所有蛋白质条目。DSSP也是从PDB条目计算DSSP条目的程序。DSSP并不预测二级结构。&lt;br /&gt;
&lt;br /&gt;
* 根据氢键模式和主链构象，将蛋白质的每个残基分类为特定的二级结构类型。算残基之间的氢键能量，用于确定二级结构的边界。计算每个残基的溶剂可及表面积（ASA），反映其在蛋白质表面的暴露程度。&lt;br /&gt;
* 输入：蛋白质的三维结构文件（通常为PDB格式）。输出：包含每个残基的二级结构类型、氢键信息、溶剂可及性等数据的文本文件。&lt;br /&gt;
&lt;br /&gt;
Pfam数据库重视&#039;&#039;&#039;蛋白质结构域和家族&#039;&#039;&#039;（基于序列同源性）分为Pfam-A和Pfam-B。。Pfam数据库主要用于蛋白质家族的分类和功能注释。&lt;br /&gt;
&lt;br /&gt;
* Pfam-A是手工整理的高质量家族集合，&lt;br /&gt;
* Pfam-B是自动生成的家族集合，具有更广泛但相对较低的准确性&lt;br /&gt;
&lt;br /&gt;
* 关注功能相关的蛋白质区域（如结构域），而非完整蛋白质的结构。&lt;br /&gt;
&lt;br /&gt;
* 分类依据：&lt;br /&gt;
** &#039;&#039;&#039;序列相似性&#039;&#039;&#039;，通过隐马尔可夫模型（HMM）比对识别保守区域。&lt;br /&gt;
** 基于多序列比对和进化关系。&lt;br /&gt;
&lt;br /&gt;
* 层次结构：&lt;br /&gt;
** 超家族（Clan）：多个家族在进化或功能上的关联。&lt;br /&gt;
** 家族（Family）：具有显著序列相似性的结构域集合&lt;br /&gt;
* Pfam的链接都已经重新定位到Interpro了,也是EMBL-EBI生的&lt;br /&gt;
&lt;br /&gt;
CATH数据库提供蛋白质三维结构与分类，关注&#039;&#039;&#039;结构的拓扑和进化起源&#039;&#039;&#039;。&lt;br /&gt;
&lt;br /&gt;
* 蛋白质三维结构的层次化分类（从二级结构到进化关系）以三维结构特征为依据，结合序列和功能信息进行分类&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构组成（如全α、全β、α+β、α/β）。&lt;br /&gt;
*# Architecture（架构）：描述二级结构的空间排布（如β桶、α螺旋束）。&lt;br /&gt;
*# Topology（拓扑）：基于折叠方式和连接性。&lt;br /&gt;
*# Homologous Superfamily&#039;&#039;&#039;（&#039;&#039;&#039;同源超家族）：进化相关的蛋白质。&lt;br /&gt;
&lt;br /&gt;
SCOP数据库分类强调进化同源性，基于结构与进化关系分类，由&#039;&#039;&#039;专家手动分类，强调超家族内的远缘同源关系。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构类型（如全α、全β等）。&lt;br /&gt;
*# Fold（折叠方式）：具有相似拓扑结构的蛋白质。&lt;br /&gt;
*# Superfamily（超家族）：推测具有共同祖先的结构相似蛋白质。&lt;br /&gt;
*# Family（家族）：明确序列同源性的蛋白质集合。&lt;br /&gt;
&lt;br /&gt;
* SCOPe引入自动化分类，但核心仍保留手动注释。&lt;br /&gt;
&amp;lt;这段deepseek写的，我对着笔记查了一下&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== 搞人小数据库，考了之后就把名字全记下来了 ==&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质三级结构预测 ===&lt;br /&gt;
* I-TASSER穿线法预测：有相似才能用从PDB中识别结构模板，并通过基于迭代模板的碎片组装模拟构建完整的原子模型(将蛋白质“穿入”已有的蛋白质结构模板)。 接着通过蛋白质功能数据库BioLiP对3D模型进行重新线程化，从而预测功能。&lt;br /&gt;
** 有人把ITASSER归进从头建模了&lt;br /&gt;
&lt;br /&gt;
* Swissmodel同源建模：按照FASTA格式输入氨基酸序列，要有相似度&amp;gt;30%的蛋白质模板&lt;br /&gt;
** 同源建模也称为比较建模，根据与已知结构的序列同源性预测蛋白质结构。基于“如果两个蛋白质具有足够高的序列相似性，它们很可能具有非常相似的三维结构”的原理。如果蛋白质序列之一具有已知结构，则可以以高置信度将该结构复制/映射到未知蛋白质。&lt;br /&gt;
** 质量评估：其中相似度值，即序列同源性经比对后结果在 40% 以上，则待预测蛋白与模板蛋白结构大概为同源蛋白，则同源建模方法可用于预测该蛋白三维结构。根据GMQE值及ＱＭEAN值评价结果，都是全局比对。&lt;br /&gt;
*** GMQE值在0－1之间，越接近１则建模质量越好&lt;br /&gt;
*** QMEAN值关于覆盖率区间为－４－０，越接近０则匹配度越好。&lt;br /&gt;
** 此功能在Modelle(蛋白质复合体同源建模)与Discovery Studio与AlphaFold-Multimer亦有记载&lt;br /&gt;
* QUARK从头计算：从头经历复杂的算法归纳到能量最低，此事在Alphafold亦有记载&lt;br /&gt;
* Rosetta综合以上算法，但亦有说同源建模的&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质功能与结构域数据库&amp;amp;预测 ===&lt;br /&gt;
&lt;br /&gt;
* InterPro是集成的蛋白质结构域和功能位点数据库，包含关于蛋白质家族、域、重复序列、和作用位点等数据资源。InterPro通过将蛋白质分类为家族并预测结构域和重要位点来提供蛋白质的功能分析。为了以这种方式对蛋白质进行分类，InterPro 使用由组成 InterPro 联盟的多个不同数据库（称为成员数据库）提供的预测模型（称为特征）。&lt;br /&gt;
** InterPro包含很多来自不同数据库的人工注释文件，形成了一个给定的蛋白质家族、结构域和功能位点的独特描述。&lt;br /&gt;
** Interpro数据库成员包括Coils 、Gene3D、Pfam、PRINTS、ProSitePatterns、ProSiteProfiles、SMART、SUPERFAMILY、 TIGRFAM、ProDom、PIR 数据库，每两个月更新一次&lt;br /&gt;
** EBI生的，可能假阳性&lt;br /&gt;
* Pfam数据库是一个庞大的蛋白质家族集合，每个家族都由多个序列比对和隐马尔可夫模型（HMMs）表示&lt;br /&gt;
* SMART 是一个用于蛋白质结构域鉴定、注释的在线分析工具。它的数据与UniProt、Ensembl和STRING数据库同步&lt;br /&gt;
** 您可以在两种不同的模式下使用 SMART：&#039;&#039;&#039;正常&#039;&#039;&#039;模式或&#039;&#039;&#039;基因组&#039;&#039;&#039;模式。主要区别在于所使用的基础蛋白质数据库。&lt;br /&gt;
** 在 &#039;&#039;&#039;Normal SMART&#039;&#039;&#039; 中，数据库包含 Swiss-Prot、SP-TrEMBL 和稳定的 Ensembl 蛋白质组。即使删除了相同的蛋白质，Normal SMART 中的蛋白质数据库具有显著的冗余性，&lt;br /&gt;
** 在 &#039;&#039;&#039;Genomic SMART&#039;&#039;&#039; 中，仅使用完全测序基因组的蛋白质组;后生动物的 Ensembl 和其余的 Swiss-Prot。如果您使用 SMART 来探索结构域架构，或者想要在各种基因组中查找确切的结构域计数，请考虑切换到&#039;&#039;&#039;基因组&#039;&#039;&#039;模式。结构域标注页中的数字会更准确，架构查询结果中不会有很多对应同一个基因的蛋白片段。&lt;br /&gt;
&lt;br /&gt;
=== 蛋白相互作用库 ===&lt;br /&gt;
&lt;br /&gt;
* DIP&amp;lt;sup&amp;gt;TM&amp;lt;/sup&amp;gt; 数据库对实验确定的蛋白质之间的相互作用进行了编目。它结合了来自各种来源的信息，以创建一组单一、一致的蛋白质-蛋白质相互作用。存储在 DIP 数据库中的数据既由专家策展人手动管理，也使用计算方法自动管理&lt;br /&gt;
* BioGRID(Biological General Repository for Interaction Datasets)数据库 生物相互作用网络，是由大量单个蛋白质或遗传相互作用以及RNA，DNA，膜，碳水化合物和小分子代谢物的相互作用聚集形成的，BioGRID致力于所有主要模式生物物种和人类的蛋白质，遗传和药物相互作用的管理和存[https://www.jianshu.com/p/63a5834c2fe9 储]&lt;br /&gt;
** 合并了DrugBank中的化学-蛋白质相互作用记录&lt;br /&gt;
** 为了协调和统一不同模式生物研究中使用的各种遗传相互作用术语，BioGRID与WormBase([https://wormbase.org/#012-34-5 线虫数据库])合作开发了新的标准化遗传相互作用结构术语或GIST。GIST已设计为使用通用遗传相互作用术语精确指定遗传相互作用&lt;br /&gt;
** BioGRID ORCS：用于CRISPR筛选数据的存储单元&lt;br /&gt;
* STRING功能性蛋白质关联网络。收集多个公共数据库，包括UniProt、KEGG、NCBI和Gene Ontology整合并生成一个全面的蛋白质相互作用网络数据库。&lt;br /&gt;
** 返回结果是网状的蛋白质互作消息&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质多序列比对 ===&lt;br /&gt;
多序列比对MSA是指把多条（3 条或以上）有系统进化关系的蛋白质分子的氨基酸序列或核酸序列进行比对，尽可能地把相同的碱基或氨基酸残基排在同一列上。对齐的碱基或氨基酸残基在进化上是同源的，即来自共同祖先。&lt;br /&gt;
&lt;br /&gt;
序列比对主要是为了寻找相似的序列，相似的序列往往起源于一个共同的祖先序列，它们很可能有相似的空间结构和生物学功能，有利于推测这个未知结构和功能的蛋白质的结构和功能。&lt;br /&gt;
&lt;br /&gt;
* Tcoffee核酸和蛋白质都可以&lt;br /&gt;
** 基本原理是首先构建一个包含有clustalw得到的序列两两比对和fasta得到的局部两两比对数据的库,并且给每个比对一个权重.然后把结果进行整合,最后是progressive比对过程.&lt;br /&gt;
** Rcoffee可以根据预测的RNA二级结构对比序列&lt;br /&gt;
* ClustralW有快慢两种模式，&lt;br /&gt;
** 原理是两两比对-&amp;gt;两两之间距离矩阵-&amp;gt;NJ建Binary进化树作为guidetree-&amp;gt;用progressive的方法添加序列到树上直到比对完成&lt;br /&gt;
** 有Accurate慢和Appropriate快两种模式，Accruate比Tcoffee快，Appropriate比Muscle慢&lt;br /&gt;
* Muscle&lt;br /&gt;
** 它之所以比clustalw快一方面是因为没有进行两两序列比对,用序列间共有的word数表征序列间的相似性;另一方面用UPGMA代替NJ构建guide tree. 如果没有对于结果的refinement过程,时间更短,时间复杂度为O(NL^2),也就是说时间和序列数成线性关系.&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质数据质量评估 ===&lt;br /&gt;
&lt;br /&gt;
* PROCHECK&lt;br /&gt;
** 在对蛋白的二级结构进行评估之时,一个重要的指标就是二面角φ, ψ是否在合理范围之内, 其中φ代表 α 碳原子和氮原子间的键的旋转度phi, ψ代表α碳原子和羰基碳原子间的键的旋转度。PROCHECK可以计算给定PDB文件的所有φ, ψ二面角, 然后给出总的评估结果,并将结果绘制成Ramachandran图表示。&lt;br /&gt;
** 不少于90%的二面角分布在图中的合理(蓝色)区域，则蛋白结构合理&lt;br /&gt;
* VERIFY_3D&lt;br /&gt;
** 对同源建模所得模型的质量进行了可视化分析，用来判断模型与氨基酸序列之间的兼容性。&lt;br /&gt;
** 对氨基酸残基数大于100的蛋白质，VERIFY_3D的评估结果更准确。&lt;br /&gt;
** 当不低于80%的氨基酸残基得分大 0.2时，即可认为目的蛋白建模所得模型属于高质量的模型结构。&lt;br /&gt;
* [https://proq.bioinfo.se/ProQ/ProQ.html ProQ - 蛋白质质量评价]&amp;lt;这个没找到总结&amp;gt; ProQ 是一种基于神经网络的预测器，它基于许多 结构特征可预测蛋白质模型的质量。ProQ 是 优化以找到正确的模型，与其他方法相比 经过优化以查找原生结构。两个质量衡量标准是 预测 LGscore 和 MaxSub。  LGscore 是 P 值的 -log，MaxSub 范围为 0-1，其中 0 为 微不足道和 1 个非常显著。&lt;br /&gt;
&lt;br /&gt;
=== 跨膜序列预测 ===&lt;br /&gt;
&lt;br /&gt;
* TMHMM由丹麦的CBS维护，使用隐马尔可夫模型预测跨膜蛋白序列&lt;br /&gt;
&lt;br /&gt;
* TMpred预测蛋白质的跨膜结构域（TMDs），基于氨基酸疏水性分析。输入蛋白质序列，输出跨膜区的位置、与拓扑结构（膜内/膜外方向）&lt;br /&gt;
&lt;br /&gt;
=== 信号肽SignalP ===&lt;br /&gt;
&lt;br /&gt;
* 预测蛋白质的 信号肽及其切割位点，判断是否为分泌蛋白或膜蛋白。&lt;br /&gt;
* &#039;&#039;&#039;输入&#039;&#039;&#039;：蛋白质序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：信号肽位置、切割位点概率、分泌类型（Sec/SPI/Tat）。&lt;br /&gt;
&lt;br /&gt;
=== 调控元件与内含子/外显子 ===&lt;br /&gt;
&lt;br /&gt;
* PLACE&#039;&#039;&#039;植物顺式作用元件数据库&#039;&#039;&#039;（Plant Cis-Acting Regulatory DNA Elements），存储植物启动子区域的功能性调控元件。&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：DNA序列（如启动子区域）。&#039;&#039;&#039;输出&#039;&#039;&#039;：匹配的调控元件名称、位置及功能注释。&lt;br /&gt;
* Augustus真核生物基因结构预测&lt;br /&gt;
** 基于隐马尔可夫模型（HMM）和物种特异性训练数据预测基因结构。&lt;br /&gt;
*** 可以直接预测训练之后的物种。若不存在被训练过的物种，需要[https://www.jianshu.com/p/6f7b2998600c 准备训练集和测试集进行训练]  可靠的基因结构序列的要求如下： 之后随机将注释数据集分成训练集和测试集，测试集要足够多的基因（100~200个），并且要足够的随机。  a. 提供基因的编码部分，包含上游几KB。通常，基因越多越好。还得保证有足够多的外显子，这样子才能训练内含子  b. 这些基因的基因结构一定足够准确。不过，也不需要百分百正确，只要保证起始密码子和终止密码子是准确的。  c. 需要保证这些基因没有冗余，不同序列如果有几乎相同的注释后氨基酸序列，那么仅仅取其中一个  d. 一条序列允许有多个基因，基因可以在正链也可以在负链，但是这些基因间不能有重叠，每个基因只要其中一个转录本，存放格式是GenBank&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：基因组DNA序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：预测的基因模型（外显子、内含子、CDS区域）、蛋白质序列。&lt;br /&gt;
* ORFfinder&lt;br /&gt;
** 识别DNA序列中的 开放阅读框ORF，基于遗传密码表扫描可能的编码区域。&lt;br /&gt;
** &#039;&#039;&#039;输入&#039;&#039;&#039;：DNA序列。&#039;&#039;&#039;输出&#039;&#039;&#039;：ORF的位置、长度、翻译的氨基酸序列。&lt;br /&gt;
&lt;br /&gt;
=== 蛋白质物理特性识别 ===&lt;br /&gt;
Compute pI/Mw&lt;br /&gt;
&lt;br /&gt;
* 计算蛋白质的 &#039;&#039;&#039;等电点（pI） 和 分子量（Mw）&#039;&#039;&#039;，基于氨基酸序列的电荷分布和组成。&lt;br /&gt;
* &#039;&#039;&#039;输入&#039;&#039;&#039;：蛋白质氨基酸序列（FASTA格式）。&#039;&#039;&#039;输出&#039;&#039;&#039;：pI和Mw的数值结果。&lt;br /&gt;
ExPasy的protogram数据库亦有记载&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E5%8F%A3%E8%AF%80%E5%AD%A6&amp;diff=4890</id>
		<title>生物口诀学</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E5%8F%A3%E8%AF%80%E5%AD%A6&amp;diff=4890"/>
		<updated>2025-03-17T02:33:28Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* 常见抗生素/毒素的靶标细胞和效果 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;来吧&lt;br /&gt;
&lt;br /&gt;
== 第一部分 ==&lt;br /&gt;
&lt;br /&gt;
===生物化学与分子生物学===&lt;br /&gt;
&#039;&#039;&#039;各种各样氨基酸&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
分支缬二亮&lt;br /&gt;
&lt;br /&gt;
丝苏酪有羟&lt;br /&gt;
&lt;br /&gt;
苯色酪芳香&lt;br /&gt;
&lt;br /&gt;
严格酮赖亮&lt;br /&gt;
&lt;br /&gt;
糖酮异苯酪色苏&lt;br /&gt;
&lt;br /&gt;
酸天谷碱赖精组&lt;br /&gt;
&lt;br /&gt;
稳缬甲丙甘丝苏（第一个氨基酸稳定的）&lt;br /&gt;
&lt;br /&gt;
不转氨，赖苏脯&lt;br /&gt;
&lt;br /&gt;
一碳来甘色丝组&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;&#039;&#039;氨基酸分类+单字母缩写&#039;&#039;&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
极性无电荷：年前速通MC（NQSTMC；天冬酰胺 谷氨酰胺 丝 苏 甲硫 半胱）&lt;br /&gt;
&lt;br /&gt;
芳香族：我要疯（WYF；色 酪 苯丙）另：特别无厘头的联想：280nm紫外吸收→“色aa”→Trp←Trump←共和党（红色）&lt;br /&gt;
&lt;br /&gt;
极性负电荷：大鹅（DE；天 谷 ；大鹅脾气暴躁，十分negative（消极，也是负电））&lt;br /&gt;
&lt;br /&gt;
极性正电荷：好客人（HKR；组 赖 精；一看就是个积极向上的词嘛，正电）&lt;br /&gt;
&lt;br /&gt;
非极性：VIP延迟（低）（VIP：缬 异 脯；延迟即LAG：&amp;lt;s&amp;gt;晾饼干&amp;lt;/s&amp;gt;亮 丙 甘；VIP延迟低所以不急，非急性（）&lt;br /&gt;
&lt;br /&gt;
（欢迎补充~）&lt;br /&gt;
&lt;br /&gt;
====氨基酸单字母记忆====&lt;br /&gt;
# “看到天，想到地”（天冬氨酸D） 天冬氨酸四个C，字母D第四个&lt;br /&gt;
# 谷氨酸五个C，字母E第五个。&lt;br /&gt;
# &amp;lt;s&amp;gt;背得差不多之后把二十六个字母全写出来然后一一对应，多来几次，效果极佳。&amp;lt;/s&amp;gt;&lt;br /&gt;
# 砍人后的服务员，去哪埋藏尸体？谷爱凌VIP！！！&amp;lt;s&amp;gt;{网上看见的，侵删}&amp;lt;/s&amp;gt;&lt;br /&gt;
## 砍人后：KRH-Lys/Arg/His【赖、精、组→正电】&lt;br /&gt;
## 的：DE-Asp/Glu【天冬、谷→负电】&lt;br /&gt;
## 服务员：FWY-Phe/Trp/Tyr【苯丙、色、酪→芳香族】&lt;br /&gt;
## 去哪：QN-Gln/Asn【谷氨酰胺、天冬酰胺】&lt;br /&gt;
## 埋藏尸体：MCST-Met/Cys/Ser/Thr【甲硫、半胱、丝、苏→这6个是极性不带电的，以上14个都是极性的】&lt;br /&gt;
## 谷爱凌VIP：GALVIP-Gly/Ala/Leu/Val/Ile/Pro【甘、丙、亮、缬、异亮、脯→非极性{注：极性与非极性氨基酸存在争议}】&lt;br /&gt;
## 另外注意MCST和GALVIP都是以首字母作为缩写的&lt;br /&gt;
&lt;br /&gt;
==== 必需氨基酸 ====&lt;br /&gt;
* 笨蛋来宿舍晾一晾鞋 (Phe Met Lys Thr Trp Leu Ile Val)&lt;br /&gt;
* 携一两本单色书来 (此处“一两”同时指代Leu和Ile)&lt;br /&gt;
* 甲携来一本亮色书 (Met Val Lys Ile Phe Leu Trp Thr)&lt;br /&gt;
* 甲写来一两本黄色书（Met Val Lys Ile Leu Phe His Trp Thr，其中“黄”首字母H，His现已被证明为必需氨基酸）&lt;br /&gt;
[[文件:嘧啶环.png|缩略图|201x201像素]]&lt;br /&gt;
&lt;br /&gt;
====嘧啶环原子来源====&lt;br /&gt;
三姑哀叹四天（3N谷氨酰胺，2C源CO2，其余四原子（1N，4C，5C，6C）天冬氨酸&lt;br /&gt;
&lt;br /&gt;
二探三姑分四天[[文件:嘌呤环各个原子的来源.jpg|缩略图|332x332像素]]&lt;br /&gt;
====嘌呤环原子来源==== &lt;br /&gt;
&lt;br /&gt;
# 一个月一天课，二十八天是假，六探亲朋好友，三舅送来鲜骨，五四旗杆挥舞。&amp;lt;br&amp;gt;1C天冬氨酸，2C,8C源N5-N10甲酰四氢叶酸，6C二氧化碳，3N,9N谷氨酰胺，5C,4C,7N甘氨酸&lt;br /&gt;
# 三九谷氨二八甲酸，四五七甘一天六碳&lt;br /&gt;
# 附一个结构记忆法（见右图）：谷氨酰胺的两个N原子在结构式的最下面，可以联想记忆为“谷子”长在地里；天冬氨酸的N在六元环偏上面的位置，正好与「天」字对应；两个一碳单位提供最左边与最右边的碳原子，理解为「左右护法」；剩下的即为甘氨酸的原子。&lt;br /&gt;
# 三舅姑一天六探，假二爸四五七也干（39：谷氨酰胺，1：天冬氨酸，6：CO2，28：N10甲酰四氢叶酸，457：甘氨酸）&lt;br /&gt;
&lt;br /&gt;
====摆动法则====&lt;br /&gt;
I配对ACU（G哥不配！G哥配U！）&lt;br /&gt;
&lt;br /&gt;
I always see you联想视件👁👁&lt;br /&gt;
&lt;br /&gt;
G哥也要CU~&lt;br /&gt;
&lt;br /&gt;
====氨基酸生糖/生酮====&lt;br /&gt;
* &#039;&#039;&#039;生酮氨基酸&#039;&#039;&#039;“L”oo“K”  酮亮赖&lt;br /&gt;
&lt;br /&gt;
* &#039;&#039;&#039;生糖兼生酮氨基酸&#039;&#039;&#039; &amp;quot;一本色书辣”&amp;lt;br&amp;gt;异亮氨酸，苯丙氨酸，色氨酸，苏氨酸，酪氨酸（杨sir发音系统）&lt;br /&gt;
&lt;br /&gt;
====蛋白质N端的第一个氨基酸====&lt;br /&gt;
法1：代表蛋白质稳定的：&lt;br /&gt;
    甲脯苏缬，【甲辅书写】&lt;br /&gt;
    丙半甘丝。【丙拌干丝】&lt;br /&gt;
   【记忆方法：家庭（蛋白质）“稳定”榜No.1（N端第1个AA）的，就是一个家长辅导书写（学习），另一个家长做饭（拌干丝），真是幸福的场景啊…】&lt;br /&gt;
法2：CAMP-GST-V&lt;br /&gt;
&lt;br /&gt;
联想记忆法：露营（CAMP）时突然有人拿着商品与服务税（GST）的税单朝你比了个耶（V）&lt;br /&gt;
&lt;br /&gt;
==== 胶原蛋白诗一首 ====&lt;br /&gt;
一五并驱骨中现，致密结缔很常见。(韧带、真皮、肌腱、巩膜或角膜)&lt;br /&gt;
&lt;br /&gt;
九侧贴二共十一，脊索软骨玻璃体。&lt;br /&gt;
&lt;br /&gt;
三皮血管内器官，症状凄凄同五惨。(皮肤易损、血管易破、关节松软)&lt;br /&gt;
&lt;br /&gt;
四网十八初基膜，后者视网膜脱落。(缺十八的症状)&lt;br /&gt;
&lt;br /&gt;
七鳞上皮锚纤维，十七纤维共起疱。(鳞状上皮、锚定纤维)&lt;br /&gt;
&lt;br /&gt;
一二三五九纤维，十七十八非纤维。&lt;br /&gt;
&lt;br /&gt;
四基蛋羟赖交联，次溴辅硫亚胺键。(来自杨Sir)&lt;br /&gt;
&lt;br /&gt;
== 第二部分 ==&lt;br /&gt;
&lt;br /&gt;
===植物学===&lt;br /&gt;
&lt;br /&gt;
==== &#039;&#039;&#039;有节乳汁管&#039;&#039;&#039; ====&lt;br /&gt;
罂粟菊旋花，芭蕉番木瓜。&lt;br /&gt;
&lt;br /&gt;
==== &#039;&#039;&#039;内生菌根&#039;&#039;&#039; ====&lt;br /&gt;
杜鹃花胡桃，桑兰李葡萄。&lt;br /&gt;
&lt;br /&gt;
==== &#039;&#039;&#039;藻类叶绿素&#039;&#039;&#039; ====&lt;br /&gt;
绿裸褐硅红，BBCCD。&lt;br /&gt;
&lt;br /&gt;
==== &#039;&#039;&#039;种子与胚乳的羁绊&#039;&#039;&#039; ====&lt;br /&gt;
·1.双子叶植物但是有胚乳种子：木兰田菁枣柿苋，桑戟胡茄荞麦莲。【木兰科、田菁（豆科）、&amp;lt;big&amp;gt;&#039;&#039;&#039;黑枣（柿科）&#039;&#039;&#039;&amp;lt;/big&amp;gt;、柿（柿科）、苋菜（苋科）、桑（桑科）、戟（大戟科）、胡萝卜（伞形科）、茄科、荞麦（蓼科）、莲（莲科）】&lt;br /&gt;
&lt;br /&gt;
记忆方法：木兰和田菁寻找（枣）视线，看见了桑戟（一个人名）吹着胡笳（jia），身边有荞麦和莲花&lt;br /&gt;
&lt;br /&gt;
·2.姜石甜睡胡椒外，（“僵尸”“酣hān睡”&amp;lt;small&amp;gt;（这是故意读错的）&amp;lt;/small&amp;gt;，即姜、石竹、甜菜、睡莲、胡椒是外胚乳种子）&lt;br /&gt;
&lt;br /&gt;
兰菱川苔不发生。（兰陵王和川台什么事情都没有发生，即兰科、菱科、川苔草科的种子胚乳不发生）&lt;br /&gt;
&lt;br /&gt;
慈泻眼菜无胚乳，（辞谢，即慈姑、泽泻、眼子菜是无胚乳种子）&lt;br /&gt;
&lt;br /&gt;
单有双无大多数。（其他大多数的单子叶植物种子有胚乳，双子叶植物种子无胚乳）&lt;br /&gt;
&lt;br /&gt;
==== &#039;&#039;&#039;子房上位&#039;&#039;&#039; ====&lt;br /&gt;
芸香石竹茄木兰，木犀蔷薇豆天南。锦葵泽泻唇毛茛，十字百合上禾本。&lt;br /&gt;
&lt;br /&gt;
（子房上位的科：芸香科、石竹科、茄科、木兰科、木犀科、蔷薇科除了梨亚科、豆科、天南星科、锦葵科、泽泻科、唇形科、毛茛科、十字花科、百合科、禾本科）&lt;br /&gt;
&lt;br /&gt;
==== &#039;&#039;&#039;子房下位&#039;&#039;&#039; ====&lt;br /&gt;
壳斗梨葫芦，伞形兰下菊。（子房下位的科：壳斗科、梨亚科、葫芦科、伞形科、兰科、菊科）&lt;br /&gt;
&lt;br /&gt;
==== &#039;&#039;&#039;中轴胎座&#039;&#039;&#039; ====&lt;br /&gt;
山毛榉姜苹，芸锦茄百合。（山毛榉科&amp;lt;small&amp;gt;（即壳斗科）&amp;lt;/small&amp;gt;、姜属、蔷薇科原苹果亚科、芸香科、锦葵科、茄科、百合科）&lt;br /&gt;
&lt;br /&gt;
==== &#039;&#039;&#039;假二叉分枝&#039;&#039;&#039; ====&lt;br /&gt;
假槲竹香（槲寄生 石竹 丁香）&lt;br /&gt;
&lt;br /&gt;
==== &#039;&#039;&#039;周木维管束&#039;&#039;&#039; ====&lt;br /&gt;
祖母杀娼——怨啊！（周木：莎草「值得一提的是念suo’cao」 菖蒲 鸢尾）&lt;br /&gt;
&lt;br /&gt;
==== &#039;&#039;&#039;气孔类型&#039;&#039;&#039; ====&lt;br /&gt;
西无景布，江平石横。（西瓜无规则，景天不等，豇「值得一提的是念jiang」豆平列，石竹横列）西边没有了景布将军的把手，战败后江水平静碎石横七竖八。&lt;br /&gt;
&lt;br /&gt;
==== &#039;&#039;&#039;减数分裂&#039;&#039;&#039; ====&lt;br /&gt;
衣合刺配石莼同，硅配紫异多管同。海带异型网地同，鹿角配子减数终。&lt;br /&gt;
&lt;br /&gt;
（注释与记忆方法：第一句都是绿藻：衣合，音“伊核（协议）”，衣藻行合子减数分裂；刺配，指刺松藻等行配子减数分裂；石莼同，音“是纯铜”或者“是纯同”，即石莼行同型世代交替的孢子减数分裂。硅配，音“规培”，硅藻行配子减数分裂；红藻之中：紫异，音“自缢”，紫菜行异型世代交替的孢子减数分裂；多管同，多管藻等行同型世代交替的孢子减数分裂。剩下3个都是褐藻，海带行异型世代交替的孢子减数分裂，网地藻行同型世代交替的孢子减数分裂，鹿角菜行配子减数分裂）&lt;br /&gt;
&lt;br /&gt;
====合子减数分裂====&lt;br /&gt;
一团合子撕水轮（衣 团藻 丝藻 水绵 轮藻）&lt;br /&gt;
&lt;br /&gt;
====配子减数分裂====&lt;br /&gt;
🦌管硅伞送🐎（鹿藻 管藻 硅藻 伞藻 松藻 马尾藻）（这个感觉不太好 欢迎改进）&lt;br /&gt;
&lt;br /&gt;
关山归路马尾松（管伞硅鹿马尾松）&lt;br /&gt;
&lt;br /&gt;
贵马尾松散管撸（硅马尾松伞管鹿）（我记得有地方方言有“管+动词”的说法，大概是尽情去做的意思，也有点展现大气的意味…）&lt;br /&gt;
&lt;br /&gt;
====孢子异形====&lt;br /&gt;
卷满一瓶槐水&amp;lt;br&amp;gt;&lt;br /&gt;
卷柏 满江红 萍 槐叶萍 水韭&lt;br /&gt;
&lt;br /&gt;
====唇形科====&lt;br /&gt;
方茎对叶油挥发，轮伞花序唇形花&lt;br /&gt;
&lt;br /&gt;
====花程式记忆====&lt;br /&gt;
K萼C冠P花被，A雄G雌线表位&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;百合是同被花&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
因为百合是同，三数五轮，子房上位。&lt;br /&gt;
&lt;br /&gt;
==== 植物分类学 ====&lt;br /&gt;
&#039;&#039;&#039;柿树科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
单叶全缘常互生，雌雄常异花单性。&lt;br /&gt;
&lt;br /&gt;
宿存花萼果期大，花冠旋转3-7。&lt;br /&gt;
&lt;br /&gt;
雄蕊基生倍数生，子房上位有多室。&lt;br /&gt;
&lt;br /&gt;
浆果种子有薄皮，柿与君迁味道鲜。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;木犀科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
木本植物对生叶，两性花冠无托叶。&lt;br /&gt;
&lt;br /&gt;
圆锥聚伞顶或腋，花萼花冠常4裂。&lt;br /&gt;
&lt;br /&gt;
雄蕊2枚常下位，两个心皮房上位。&lt;br /&gt;
&lt;br /&gt;
浆核翅蒴种类多，观赏绿化用此科。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;马钱科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
两性整齐为单叶，花序多歧再排列。&lt;br /&gt;
&lt;br /&gt;
花萼花冠45裂，冠生雄蕊常内藏。&lt;br /&gt;
&lt;br /&gt;
子房上位常2室，蒴果浆果核果生。&lt;br /&gt;
&lt;br /&gt;
醉鱼草多香美丽，观赏栽培作药行。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;夹竹桃科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
草木藤本多年生，乳汁水液遍全身。&lt;br /&gt;
&lt;br /&gt;
草叶全缘对或轮，托叶常退脉羽状。&lt;br /&gt;
&lt;br /&gt;
大花两性形整齐，萼常5裂冠合瓣。&lt;br /&gt;
&lt;br /&gt;
花冠喉部有附属，5枚雄蕊生于上。&lt;br /&gt;
&lt;br /&gt;
子房上位心皮2，浆核朔果蓇葖果。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;萝藦科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
草本藤本常攀援，块根肉质乳汁粘。&lt;br /&gt;
&lt;br /&gt;
单叶全缘脉羽状，聚伞花序成伞状。&lt;br /&gt;
&lt;br /&gt;
花冠合瓣檐5裂，雌雄粘生合蕊柱。&lt;br /&gt;
&lt;br /&gt;
子房上位2心皮，侧膜胎座蓇葖果。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;旋花科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
缠绕匍匐草质藤，常有乳汁叶互生。&lt;br /&gt;
&lt;br /&gt;
叶形多样花生腋，梗细常有2苞片。&lt;br /&gt;
&lt;br /&gt;
冠生雄蕊有5枚，漏斗花冠相互生。&lt;br /&gt;
&lt;br /&gt;
中轴胎座两胚珠，子房上位蒴果成。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;花荵科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
互生对生常草本，两性花为5基数。&lt;br /&gt;
&lt;br /&gt;
花冠辐状或筒状，雄蕊5枚冠筒上。&lt;br /&gt;
&lt;br /&gt;
花盘环状常5裂，子房上位心皮变。&lt;br /&gt;
&lt;br /&gt;
中轴胎座成蒴果，中华花荵绿化多。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;紫草科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
草本植物被硬毛，单叶互生多粗糙。&lt;br /&gt;
&lt;br /&gt;
单歧蝎尾聚散序，5枚雄蕊冠上找。&lt;br /&gt;
&lt;br /&gt;
花萼5枚冠5瓣，喉部常有附属物。&lt;br /&gt;
&lt;br /&gt;
两个心皮4深裂，复雌蕊生4坚果。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;马鞭草科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
单叶对生茎具棱，常无托叶叶对生。&lt;br /&gt;
&lt;br /&gt;
花序穗状或聚伞，花萼杯状果宿存。&lt;br /&gt;
&lt;br /&gt;
花冠合生45裂，雄蕊4枚为二强。&lt;br /&gt;
&lt;br /&gt;
子房上位两心皮，坚果成熟才分离。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;唇形科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
茎四棱，叶对生，挥发油脂遍全身。&lt;br /&gt;
&lt;br /&gt;
轮伞花序唇形冠，2强雄蕊高处站。&lt;br /&gt;
&lt;br /&gt;
子房上位2心合，留下4个小坚果。&lt;br /&gt;
&lt;br /&gt;
薄荷藿香与荆芥，益母黄芩可活血。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;茄科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
双韧维管叶互生，聚伞花序叶腋成。&lt;br /&gt;
&lt;br /&gt;
合瓣花冠常成筒，雄蕊5枚相互生。&lt;br /&gt;
&lt;br /&gt;
中轴胎座两心皮，每室多胚果实生。&lt;br /&gt;
&lt;br /&gt;
浆果常可作蔬菜，烟草常用蒴果栽。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;玄参科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
草多稀有树木生，单叶多为相对生。&lt;br /&gt;
&lt;br /&gt;
两性花成各花序，萼片宿存冠合生。&lt;br /&gt;
&lt;br /&gt;
二唇裂片4-5，二强雄蕊冠筒生。&lt;br /&gt;
&lt;br /&gt;
子房上位有2室，中轴胎座蒴果成。&lt;br /&gt;
&lt;br /&gt;
唇形与之多相似，茎圆而非四方棱。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;紫葳科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
乔木灌木稀草本，单叶复叶稀互生。&lt;br /&gt;
&lt;br /&gt;
两性花大多美丽，左右对称多花序。&lt;br /&gt;
&lt;br /&gt;
雄蕊5枚生冠基，裂片互生1不育。&lt;br /&gt;
&lt;br /&gt;
子房位于花盘上，1至2室多胚珠。&lt;br /&gt;
&lt;br /&gt;
家种梓树与楸树，凌霄攀上是大户。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;胡麻科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
草本多为叶对生，两侧对称花两性。&lt;br /&gt;
&lt;br /&gt;
单生叶腋顶生序，花冠筒状稍似唇。&lt;br /&gt;
&lt;br /&gt;
雄蕊4枚花互生，花盘杯状房上位。&lt;br /&gt;
&lt;br /&gt;
中轴胎座花柱1，蒴果坚果核果状。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;车前科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
草本单叶常基生，基部呈鞘脉近平。&lt;br /&gt;
&lt;br /&gt;
穗状花序有两性，花冠膜质花小型。&lt;br /&gt;
&lt;br /&gt;
雄蕊4枚冠筒内，子房上位蒴果坐。&lt;br /&gt;
&lt;br /&gt;
全草是宝药效好，叶似辐条容易找。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;茜草科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
单叶对生或轮生，两片托叶柄基生。&lt;br /&gt;
&lt;br /&gt;
花多两性辐射称，45基数样式多。&lt;br /&gt;
&lt;br /&gt;
雄蕊花冠相互生，子房下位常2室。&lt;br /&gt;
&lt;br /&gt;
蒴果核果和浆果，胚珠多数至1枚。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;忍冬科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
灌木缠绕或直立，本质柔软大髓心。&lt;br /&gt;
&lt;br /&gt;
对生叶来无托叶，两性花称聚簇生。&lt;br /&gt;
&lt;br /&gt;
花筒子房基处合，雄蕊4-5与互生。&lt;br /&gt;
&lt;br /&gt;
子房下位浆核果，药用观赏价值多。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;败酱科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
常见草本多年生，叶片对生或基生。&lt;br /&gt;
&lt;br /&gt;
羽状分裂或全缘，花小两性无托叶。&lt;br /&gt;
&lt;br /&gt;
花序聚伞圆锥状，花萼小而不明显。&lt;br /&gt;
&lt;br /&gt;
花冠筒状微具距，雄蕊3枚或4枚。&lt;br /&gt;
&lt;br /&gt;
子房下位有3室，仅有1室可发育。&lt;br /&gt;
&lt;br /&gt;
果实常见为蒴果，先端增大形成翅。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;葫芦科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
藤本植物草本质，侧生卷须可攀援。&lt;br /&gt;
&lt;br /&gt;
单叶互生掌状裂，雌雄同异花单性。&lt;br /&gt;
&lt;br /&gt;
花萼5裂花冠合，雄蕊5枚药常曲。&lt;br /&gt;
&lt;br /&gt;
子房下位3侧膜，柱头3个胚珠多。&lt;br /&gt;
&lt;br /&gt;
瓠果内质种子多，东西南北瓜水果。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;桔梗科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
多为草本稀木本，直立攀援汁液多。&lt;br /&gt;
&lt;br /&gt;
常单叶生无托叶，聚伞花序单二歧。&lt;br /&gt;
&lt;br /&gt;
两性花常相对称，萼筒子房相合生。&lt;br /&gt;
&lt;br /&gt;
花冠5裂样式多，雄蕊同数基处着。&lt;br /&gt;
&lt;br /&gt;
子房下位半下位，中轴胎座蒴果成。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;菊科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
此乃被子第一科，分布极广用极多。&lt;br /&gt;
&lt;br /&gt;
头状花序有总苞，舌花管花萼变毛。&lt;br /&gt;
&lt;br /&gt;
5枚雄蕊常合生，紧抱一起称聚药。&lt;br /&gt;
&lt;br /&gt;
下位子房珠室1，瘦果有毛随风跑。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;禾本科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
此科常有禾与竹，农工绿化功勋著。&lt;br /&gt;
&lt;br /&gt;
秆空有节基分枝，单叶互生成两列。&lt;br /&gt;
&lt;br /&gt;
叶鞘舌耳有或缺，脉纵平行好分别。&lt;br /&gt;
&lt;br /&gt;
两性花小装小穗，颖包稃片裹浆片。&lt;br /&gt;
&lt;br /&gt;
雄蕊常3药丁字，子房上位一珠室。&lt;br /&gt;
&lt;br /&gt;
颖果常作粮食用，稻麦黍粟见四处。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;莎草科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
草本常有根状茎，地上无节三棱形。&lt;br /&gt;
&lt;br /&gt;
叶有三列茎实心，或仅叶鞘闭合生。&lt;br /&gt;
&lt;br /&gt;
各种花序或小穗，毛鳞常见花被退。&lt;br /&gt;
&lt;br /&gt;
雄蕊常3雌蕊复，子房上位1珠室。&lt;br /&gt;
&lt;br /&gt;
坚果三棱凸球形，荸荠香附作药行。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;棕榈科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
木本茎直主干明，叶基宿存常抱茎。&lt;br /&gt;
&lt;br /&gt;
鞘片纤维用处广，棕垫棕绳与棕箱。&lt;br /&gt;
&lt;br /&gt;
叶似圆扁簇生顶，掌状分裂皱褶长。&lt;br /&gt;
&lt;br /&gt;
花序常为圆锥状，花小整齐性难分。&lt;br /&gt;
&lt;br /&gt;
6片花被6雄蕊，两轮排列单雌蕊。&lt;br /&gt;
&lt;br /&gt;
子房上位多3室，浆果核果长圆状。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;天南星科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
草本常有球根茎，体含乳汁气生根，&lt;br /&gt;
&lt;br /&gt;
茎基常有膜质鞘，叶形叶脉样式多。&lt;br /&gt;
&lt;br /&gt;
肉穗花序佛焰苞，宿存早落色彩耀。&lt;br /&gt;
&lt;br /&gt;
花小味臭性难分，雄蕊稀1248，&lt;br /&gt;
&lt;br /&gt;
雌蕊1枚心室多，浆果密集穗轴生。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;鸭趾草科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
多汁草本直或攀，柄基膜质鞘抱茎。&lt;br /&gt;
&lt;br /&gt;
互生单叶并行脉，辐射对称花两性。&lt;br /&gt;
&lt;br /&gt;
花被2轮外宿存，6枚雄蕊或2退。&lt;br /&gt;
&lt;br /&gt;
两个药室并或叉，1个雌蕊房上位。&lt;br /&gt;
&lt;br /&gt;
中轴胎座或蒴果，种子有棱胚盖圆。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;雨久花科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
多年草本水边生，根状茎粗或横走。&lt;br /&gt;
&lt;br /&gt;
地上茎短叶鞘包，辐射对称花两性。&lt;br /&gt;
&lt;br /&gt;
6片花被覆瓦状，6枚雄蕊缺或退。&lt;br /&gt;
&lt;br /&gt;
雌蕊1枚房上位，3室中轴1侧膜。&lt;br /&gt;
&lt;br /&gt;
果实有分蒴和胞，常见凤眼鸭舌草。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;百合科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
多年草本稀木本，基生单叶基互生。&lt;br /&gt;
&lt;br /&gt;
辐射对称花两性，6枚花被两轮生。&lt;br /&gt;
&lt;br /&gt;
同数雄蕊与花对，子房大多安上位。&lt;br /&gt;
&lt;br /&gt;
3室子房中轴座，心皮3数雌蕊复。&lt;br /&gt;
&lt;br /&gt;
茎大花美蒴果浆，葱蒜百合郁金香。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;石蒜科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
鳞茎根茎多年生，线形带状叶基生。&lt;br /&gt;
&lt;br /&gt;
伞形花序合两性，常有总苞成膜状。&lt;br /&gt;
&lt;br /&gt;
花被6枚如花瓣，雄蕊6枚两轮转。&lt;br /&gt;
&lt;br /&gt;
3个心皮如百合，子房却在下位安。&lt;br /&gt;
&lt;br /&gt;
美丽清香用处广，水仙石蒜君子兰。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;薯蓣科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
攀援缠绕多年生，块茎肉质常似根。&lt;br /&gt;
&lt;br /&gt;
叶常互生稀为对，基部心形掌脉明。&lt;br /&gt;
&lt;br /&gt;
叶柄关节常扭转，雌雄异株花单性。&lt;br /&gt;
&lt;br /&gt;
花被6片列两轮，雄蕊6枚或3退。&lt;br /&gt;
&lt;br /&gt;
子房下位有3室，蒴果3瓣有3翅。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;鸢尾科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
多年草本茎多样，长叶基生套折状。&lt;br /&gt;
&lt;br /&gt;
两性对称两轮生，花被皆为花瓣相。&lt;br /&gt;
&lt;br /&gt;
雄蕊3枚基处生，柱头3裂似花瓣。&lt;br /&gt;
&lt;br /&gt;
子房下位3心皮，胎座3室中轴长。&lt;br /&gt;
&lt;br /&gt;
蒴果背裂易种植，药用观赏皆为上。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;芭蕉科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型草本树模样，鞘状叶柄茎包上。&lt;br /&gt;
&lt;br /&gt;
互生大叶羽脉长，花序穗状圆锥状。&lt;br /&gt;
&lt;br /&gt;
两性单性皆存在，6被2轮不整齐。&lt;br /&gt;
&lt;br /&gt;
雄蕊6枚或缺1，下位子房3室生。&lt;br /&gt;
&lt;br /&gt;
丝状柱头常3个，长形浆果为水果。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;姜科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
多年草本清香气，根茎球茎单生茎。&lt;br /&gt;
&lt;br /&gt;
单叶有鞘叶舌在，椭叶线形羽状脉。&lt;br /&gt;
&lt;br /&gt;
花序总状或单生，两性花来左右称。&lt;br /&gt;
&lt;br /&gt;
花被6枚两轮生，雄蕊1育2退去。&lt;br /&gt;
&lt;br /&gt;
子房下位有3室，中轴胎座蒴果成。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;美人蕉科&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
粗大芽本多年生，根茎块状叶大型。&lt;br /&gt;
&lt;br /&gt;
羽状叶脉中脉起，鞘状抱茎无叶舌。&lt;br /&gt;
&lt;br /&gt;
两性花艳不整齐，两轮花被共6枚。&lt;br /&gt;
&lt;br /&gt;
6枚雄蕊如花瓣，也生两轮有重瓣。&lt;br /&gt;
&lt;br /&gt;
子房下位有3室，蒴果具疣种细微。&lt;br /&gt;
=== 植物生理学 ===&lt;br /&gt;
&lt;br /&gt;
==== &#039;&#039;&#039;长日照、短日照、日中性植物&#039;&#039;&#039; ====&lt;br /&gt;
长菠甜油麦，胡芹萝仙白。（长日照植物：菠菜、甜菜、油菜、大麦、小麦、胡萝卜、芹菜、萝卜、天仙子、白菜）&lt;br /&gt;
&lt;br /&gt;
短大苍烟腊，紫菊稻牵麻。（短日照植物：大豆、苍耳、美洲烟草、腊梅、紫苏、菊科、晚稻、日本牵牛、麻类）&lt;br /&gt;
&lt;br /&gt;
日中番茄辣，季蒲茄黄瓜。（日中性植物：番茄、辣椒、四季豆、蒲公英、茄子、黄瓜）&lt;br /&gt;
&lt;br /&gt;
==== &#039;&#039;&#039;短日照植物&#039;&#039;&#039; ====&lt;br /&gt;
菊科豆烟草，玉米牵（牛花）棉稻&lt;br /&gt;
&lt;br /&gt;
=== 微生物学 ===&lt;br /&gt;
&lt;br /&gt;
====常见抗生素/毒素的靶标细胞和效果====&lt;br /&gt;
1.靶标细胞：&lt;br /&gt;
&lt;br /&gt;
   氯四红青卡那霉，（靶标细胞为原核细胞的）&lt;br /&gt;
   潮嘌呤和链蓖麻，（靶标细胞为原核&amp;amp;真核细胞的）&lt;br /&gt;
   真核还有白放线。（靶标细胞为真核细胞的）&lt;br /&gt;
&lt;br /&gt;
2.抑制移位的【一个看了之后走不动道（抑制移位）的小故事】：&lt;br /&gt;
&lt;br /&gt;
   大灰狼戴上白假发，（白喉毒素）（于是有了2个奶奶👵🏻→抑制EF-2）&lt;br /&gt;
   在出口阻拦了小红帽，（红霉素，通过“阻挡”出口来抑制移位）&lt;br /&gt;
   猎人朝狼开了一枪，狼应声倒地，【潮霉素，无法a→p（拼音发音读出来类似up）】&lt;br /&gt;
   善良的小红帽最后放走了狼（放线菌酮）&lt;br /&gt;
猎人潮了狼不就拼出来了(&lt;br /&gt;
&lt;br /&gt;
3.抑制AA-tRNA和核糖体结合的：&lt;br /&gt;
   &lt;br /&gt;
   那链四嘌呤结尾（终止）&lt;br /&gt;
   （卡那霉素，链霉素，四环素，嘌呤霉素。嘌→链终止子）&lt;br /&gt;
&lt;br /&gt;
4.其他功能：&lt;br /&gt;
   GGB用链子阻止了mRNA发动技能，【B→蓖麻毒素，抑制翻译因子GTP酶（G）活性。链→链霉素，阻止蛋白质合成正确起始（m发动技能）】&lt;br /&gt;
   mRNA自知拼尽全力无法战胜，亮出身份卡，却被误解为放狠话，【卡→卡那霉素，误解→mRNA错读】&lt;br /&gt;
   好在小青及时发现阻止其吞药暴毙。【青→青霉素，抑制胞壁（暴毙）合成，吞药→转肽】&lt;br /&gt;
5.微生物培养：恒化器与恒浊器&lt;br /&gt;
&lt;br /&gt;
恒浊内控菌密度，没有限制变流速，最高速率生产主（恒化器相反）&lt;br /&gt;
&lt;br /&gt;
== 第三部分 ==&lt;br /&gt;
&lt;br /&gt;
===动物学===&lt;br /&gt;
&lt;br /&gt;
[[丢失的五脏六腑|有关泄殖腔与泄殖窦：见动物]]&lt;br /&gt;
&lt;br /&gt;
气体如何进鱼鳔？卵圆吸收红分泌。红自系膜出肝门，卵自背动出后主。&lt;br /&gt;
&lt;br /&gt;
经验规律：当生物头端朝左，无脊椎血液流向是逆时针，脊椎动物流向是顺时针。&lt;br /&gt;
&lt;br /&gt;
无脊椎动物心脏在腹面，因此腹血管由前向后；脊椎动物心脏在背面，（略）&lt;br /&gt;
&lt;br /&gt;
双壳纲入水孔出水孔怎么判断：以足为腹，上出下入。水过鳃肠，入大小出。&lt;br /&gt;
&lt;br /&gt;
无齿蚌和中国圆田螺的“左”与“右”：下入上出，左入右出，右上左下（无齿蚌出水孔和入水孔位置、中国圆田螺出水孔和入水孔位置、中国圆田螺左右食道神经节位置恰好对应）&lt;br /&gt;
&lt;br /&gt;
伸缩闭三肌相对位置：闭壳外大，缩足内小，两者成对，伸足前单。&lt;br /&gt;
&lt;br /&gt;
搞定胚层来源只需要一个固搭：植食小动物（小细胞动物极内包大细胞植物极，海绵的胚胎逆转就相反）&lt;br /&gt;
&lt;br /&gt;
胚层发育大致规律：内呼消腺，中肌生排骨，外表神感&lt;br /&gt;
&lt;br /&gt;
攀禽：风（蜂鸟目）雨烈（䴕形目）卷（鹃形目）佛缨（鹦鹉目）&lt;br /&gt;
&lt;br /&gt;
早成鸟：鸊鷉厌（雁形目）鸡鹤恨（鸻形目 ）鸥&lt;br /&gt;
&lt;br /&gt;
比目鱼&amp;lt;s&amp;gt;的手性&amp;lt;/s&amp;gt;：左鲆右鲽，左舌（舌鳎）右鳎  &lt;br /&gt;
&lt;br /&gt;
另：比目鱼目的扭转是单起源，向左向右随机！脸部左转（&amp;lt;s&amp;gt;L型&amp;lt;/s&amp;gt;）的类群和脸部右转（&amp;lt;s&amp;gt;D型&amp;lt;/s&amp;gt;）的类群是会产生生殖隔离的。&lt;br /&gt;
&lt;br /&gt;
=== &#039;&#039;&#039;动物行为学&#039;&#039;&#039; ===&lt;br /&gt;
阿朔夫规律：夜夜短日长（夜行性动物在长夜下周期变短，长日下变长，日行性相反）&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4884</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4884"/>
		<updated>2025-03-16T23:51:18Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* 蛋白质结构数据库 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
国际核苷酸序列数据库协作 （INSDC），包含NLM-NCBI(美国）,ENA(欧洲,EMBL与EBI参与),DDBJ(日本),&lt;br /&gt;
&lt;br /&gt;
其创始成员是信息和系统研究组织、日本国家遗传学研究所 （ROIS-NIG）、欧洲分子生物学实验室 - 欧洲生物信息学研究所 （EMBL-EBI） 和美国国立卫生研究院的一个组成部分,国家医学图书馆-国家生物技术信息中心 （NLM-NCBI）。&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
PubMed诞生于1996年。最常用的文摘型数据库。其收录范围不仅包括Medline，还有大部分PMC和NIH基金资助作者的文献，NCBI书籍等。PubMed还提供链接到文献全文所在网站的全文链接。早期 PubMed 数据库主要的任务，是将 Mesh 目录(MEDlINE的早期目录，主题词表)中收录的医学主题与大量有关医学研究的文献相匹配。这意味着，PubMed最早的发布时间应该是在 1971 年，也就是 MEDLINE 数据库第一次正式发布的时间。&lt;br /&gt;
&lt;br /&gt;
MEDLINE始建于1966年（追溯收录至1946年），是NLM的期刊文献记录数据库。1983年，MEDLINE推出电子版，网上数据每日更新，光盘版每月更新。MEDLINE有严格的文献选择委员会LSTRC进行选刊。目前MEDLINE的文献都收录在PubMed中。&lt;br /&gt;
&lt;br /&gt;
PMC全称为PubMed Central，建立于2000年，由NCBI进行管理，是可以免费获取全文的生物医学和生命科学全文数据库，保存了NLM收录印刷杂志的电子副本。PMC的部分bookreview内容没有收录于PubMed。&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签库&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== EMBL（European Molecular Biology Laboratory）欧洲分子生物学实验室 ==&lt;br /&gt;
总部位于德国海德堡，1974年由欧洲14个国家加上亚洲的以色列共同发起建立，现在由欧洲29个成员国政府支持组成，目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。&lt;br /&gt;
&lt;br /&gt;
[https://www.embl.org www.embl.org]&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成.2002 年，PIR 与其国际合作伙伴 EBI（欧洲生物信息学研究所）和 SIB（瑞士生物信息学研究所）一起获得了 NIH 的资助，创建了 UniProt。 通过统一 PIR-PSD、Swiss-Prot 和 TrEMBL 数据库，实现蛋白质序列和功能的单一全球数据库。&lt;br /&gt;
* Uniprot提供亚细胞定位，翻译后修饰&lt;br /&gt;
* Uniprot是包含蛋白质序列，功能信息，论文索引的蛋白质数据库，整合了包括EBI,SIB,PIR三大数据库的资源。&lt;br /&gt;
**EMBL-EBI是指欧洲生物信息学研究所（European Bioinformatics Institute），EMBL的一部分。1982年建立了先进的核苷酸序列数据库（EMBL-DNA），可进行核苷酸序列检索及序列相似性查询。TrEMBL&lt;br /&gt;
**SIB,瑞士生物信息学研究所，维护着ExPASy的服务器,Swissprot&lt;br /&gt;
*** &#039;&#039;&#039;ExPASy&#039;&#039;&#039;是一个集成了多种生物信息学工具和数据库的平台，专门用于蛋白质和蛋白质组学的研究。除了蛋白质相关的数据外，ExPASy还提供了其他生物信息学资源，如代谢通路数据库（KEGG京都代谢通路基因什么什么库）等。其中，Protparam工具是经常使用的功能，它可以根据蛋白质序列估计蛋白质的等电点（pi）、疏水性等特性。&lt;br /&gt;
**** Protscale判断蛋白质序列的疏水性，返回的结果是疏水性曲线，亲水用负值表示,疏水用正值表示。原理是滑动窗口&lt;br /&gt;
**** Prosite数据库是一个用于存储和提供蛋白质序列和结构特征的资源。 主要功能是提供蛋白质的功能和结构信息可以识别功能域和模式，可用于蛋白质家族和亲缘关系的研究，预测蛋白质结构与功能&lt;br /&gt;
** PIR，由美国国家生物医学研究基金会（NBRF）于1984年成立,用于支持基因组学、蛋白质组学和系统生物学研究和科学研究。提供蛋白质数据库和分析工具，包括蛋白质序列数据库 （PSD）。PIR-PSD&lt;br /&gt;
*数据库的关系&lt;br /&gt;
通过INSDC等得到原始数据，处理后存入UniParc。&lt;br /&gt;
&lt;br /&gt;
UniParc作为数据仓库，再分别给UniProtKB，Proteomes，UniRef提供可靠的数据集。&lt;br /&gt;
这里的UniProtKB 由两个子库构成 Swiss-Prot，TrEMBL。&lt;br /&gt;
&lt;br /&gt;
Swiss-Prot 经过人工验证和注释，是高质量的蛋白质注释数据。但人工效率在高速增长的蛋白质数据面前显得极其低效。因此，注释这些数据需要大量时间，为了弥补这一问题。TrEMBL 被建立用于存储由机器自动翻译和预测的蛋白质序列。导致蛋白质数据冗余↑可信度↓。&lt;br /&gt;
&lt;br /&gt;
简而言之，在UniProtKB数据库中Swiss-Prot是由TrEMBL经过手动注释后得到的高质量非冗余数据库，也是我们今后常用的蛋白质数据库之一。&lt;br /&gt;
&lt;br /&gt;
[https://zhuanlan.zhihu.com/p/599641613 感谢知乎qwq]&lt;br /&gt;
&lt;br /&gt;
*Uniprot内部有UniPrac，Uniref，UniProtKB三层，由粗糙到精细列&lt;br /&gt;
** 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。UniParc由于数据冗余，将相同序列合并一条，唯一编号。&lt;br /&gt;
** 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
** 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&amp;lt;TrEMBL和Swissprot热血沸腾的组合技&amp;gt;&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&lt;br /&gt;
== 蛋白质结构数据库 ==&lt;br /&gt;
&lt;br /&gt;
=== 一级结构数据库 ===&lt;br /&gt;
PDB蛋白质结构数据库(Protein Data Bank)是美国Brookhaven国家实验室于1971年创建的，由结构生物信息学研究合作组织(RCSB)维护。&lt;br /&gt;
* PDB数据库以文本文件形式存储分子数据，每个分子形用一个独立的文件。早期的分子文件的文件名后缀为“.pdb”，1997年以后每1种生物大分子对应1组(3个)相关文件分别是：全文文件(后缀为“.full”相当于原来的“.pdb”文件)、书目文件(后缀为“.biblio”)和图形文件(后缀为“.gif”)。&lt;br /&gt;
* PDB数据库是生物大分子的原子坐标和描述蛋白质和其他重要生物大分子相关信息的存储库。结构生物学家使用x 射线晶体学、核磁共振光谱和冷冻电子显微镜等方法来确定分子中每个原子相对于彼此的位置，然后存储这些信息，并由PDB数据库注释并公开发布到档案中。&lt;br /&gt;
**[https://zhuanlan.zhihu.com/p/589697113/]&lt;br /&gt;
[https://www.rcsb.org/]&lt;br /&gt;
&lt;br /&gt;
=== 二级结构数据库 ===&lt;br /&gt;
DSSP工具：DSSP程序是一个二级结构分配（以及更多信息）的数据库，涵盖PDB中的所有蛋白质条目。DSSP也是从PDB条目计算DSSP条目的程序。DSSP并不预测二级结构。&lt;br /&gt;
&lt;br /&gt;
* 根据氢键模式和主链构象，将蛋白质的每个残基分类为特定的二级结构类型。算残基之间的氢键能量，用于确定二级结构的边界。计算每个残基的溶剂可及表面积（ASA），反映其在蛋白质表面的暴露程度。&lt;br /&gt;
* 输入：蛋白质的三维结构文件（通常为PDB格式）。输出：包含每个残基的二级结构类型、氢键信息、溶剂可及性等数据的文本文件。&lt;br /&gt;
&lt;br /&gt;
Pfam数据库重视&#039;&#039;&#039;蛋白质结构域和家族&#039;&#039;&#039;（基于序列同源性），定期通过算法扩展新家族。&lt;br /&gt;
&lt;br /&gt;
* 关注功能相关的蛋白质区域（如结构域），而非完整蛋白质的结构。&lt;br /&gt;
&lt;br /&gt;
* 分类依据：&lt;br /&gt;
** &#039;&#039;&#039;序列相似性&#039;&#039;&#039;，通过隐马尔可夫模型（HMM）比对识别保守区域。&lt;br /&gt;
** 基于多序列比对和进化关系。&lt;br /&gt;
&lt;br /&gt;
* 层次结构：&lt;br /&gt;
** 超家族（Clan）：多个家族在进化或功能上的关联。&lt;br /&gt;
** 家族（Family）：具有显著序列相似性的结构域集合。&lt;br /&gt;
&lt;br /&gt;
CATH数据库提供蛋白质三维结构与分类，关注结构的拓扑和进化起源。&lt;br /&gt;
&lt;br /&gt;
* 蛋白质三维结构的层次化分类（从二级结构到进化关系）以三维结构特征为依据，结合序列和功能信息进行分类&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构组成（如全α、全β、α+β、α/β）。&lt;br /&gt;
*# Architecture（架构）：描述二级结构的空间排布（如β桶、α螺旋束）。&lt;br /&gt;
*# Topology（拓扑）：基于折叠方式和连接性。&lt;br /&gt;
*# Homologous Superfamily&#039;&#039;&#039;（&#039;&#039;&#039;同源超家族）：进化相关的蛋白质。&lt;br /&gt;
&lt;br /&gt;
SCOP数据库分类强调进化同源性，基于结构与进化关系分类，由专家手动分类，强调超家族内的远缘同源关系。&lt;br /&gt;
&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构类型（如全α、全β等）。&lt;br /&gt;
*# Fold（折叠方式）：具有相似拓扑结构的蛋白质。&lt;br /&gt;
*# Superfamily（超家族）：推测具有共同祖先的结构相似蛋白质。&lt;br /&gt;
*# Family（家族）：明确序列同源性的蛋白质集合。&lt;br /&gt;
&lt;br /&gt;
* SCOPe引入自动化分类，但核心仍保留手动注释。&lt;br /&gt;
&amp;lt;这段deepseek写的，我对着笔记查了一下&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== 搞人小数据库，考了之后就把名字全记下来了 ==&lt;br /&gt;
蛋白质结构预测&lt;br /&gt;
&lt;br /&gt;
* I-TASSER穿线法预测：有相似才能用从PDB中识别结构模板，并通过基于迭代模板的碎片组装模拟构建完整的原子模型(将蛋白质“穿入”已有的蛋白质结构模板)。 接着通过蛋白质功能数据库BioLiP对3D模型进行重新线程化，从而预测功能。&lt;br /&gt;
** 有人把ITASSER归进从头建模了&lt;br /&gt;
&lt;br /&gt;
* Swissmodel同源建模：按照FASTA格式输入氨基酸序列，&lt;br /&gt;
** 同源建模也称为比较建模，根据与已知结构的序列同源性预测蛋白质结构。基于“如果两个蛋白质具有足够高的序列相似性，它们很可能具有非常相似的三维结构”的原理。如果蛋白质序列之一具有已知结构，则可以以高置信度将该结构复制/映射到未知蛋白质。&lt;br /&gt;
** 质量评估：其中相似度值，即序列同源性经比对后结果在 40% 以上，则待预测蛋白与模板蛋白结构大概为同源蛋白，则同源建模方法可用于预测该蛋白三维结构。根据GMQE值及ＱＭEAN值评价结果，都是全局比对。&lt;br /&gt;
*** GMQE值在0－1之间，越接近１则建模质量越好&lt;br /&gt;
*** QMEAN值关于覆盖率区间为－４－０，越接近０则匹配度越好。&lt;br /&gt;
** 此功能在Modelle(蛋白质复合体同源建模)与Discovery Studio与AlphaFold-Multimer亦有记载&lt;br /&gt;
* QUARK从头计算：从头经历复杂的算法归纳到能量最低，此事在Alphafold亦有记载&lt;br /&gt;
* Rosetta综合以上算法，但亦有说同源建模的&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4872</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4872"/>
		<updated>2025-03-16T14:16:02Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* UniProt：联合蛋白质序列数据库 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
国际核苷酸序列数据库协作 （INSDC），包含NLM-NCBI(美国）,ENA(欧洲,EMBL与EBI参与),DDBJ(日本),&lt;br /&gt;
&lt;br /&gt;
其创始成员是信息和系统研究组织、日本国家遗传学研究所 （ROIS-NIG）、欧洲分子生物学实验室 - 欧洲生物信息学研究所 （EMBL-EBI） 和美国国立卫生研究院的一个组成部分,国家医学图书馆-国家生物技术信息中心 （NLM-NCBI）。&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
PubMed诞生于1996年。最常用的文摘型数据库。其收录范围不仅包括Medline，还有大部分PMC和NIH基金资助作者的文献，NCBI书籍等。PubMed还提供链接到文献全文所在网站的全文链接。早期 PubMed 数据库主要的任务，是将 Mesh 目录(MEDlINE的早期目录，主题词表)中收录的医学主题与大量有关医学研究的文献相匹配。这意味着，PubMed最早的发布时间应该是在 1971 年，也就是 MEDLINE 数据库第一次正式发布的时间。&lt;br /&gt;
&lt;br /&gt;
MEDLINE始建于1966年（追溯收录至1946年），是NLM的期刊文献记录数据库。1983年，MEDLINE推出电子版，网上数据每日更新，光盘版每月更新。MEDLINE有严格的文献选择委员会LSTRC进行选刊。目前MEDLINE的文献都收录在PubMed中。&lt;br /&gt;
&lt;br /&gt;
PMC全称为PubMed Central，建立于2000年，由NCBI进行管理，是可以免费获取全文的生物医学和生命科学全文数据库，保存了NLM收录印刷杂志的电子副本。PMC的部分bookreview内容没有收录于PubMed。&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签库&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== EMBL（European Molecular Biology Laboratory）欧洲分子生物学实验室 ==&lt;br /&gt;
总部位于德国海德堡，1974年由欧洲14个国家加上亚洲的以色列共同发起建立，现在由欧洲29个成员国政府支持组成，目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。&lt;br /&gt;
&lt;br /&gt;
[https://www.embl.org www.embl.org]&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成.2002 年，PIR 与其国际合作伙伴 EBI（欧洲生物信息学研究所）和 SIB（瑞士生物信息学研究所）一起获得了 NIH 的资助，创建了 UniProt。 通过统一 PIR-PSD、Swiss-Prot 和 TrEMBL 数据库，实现蛋白质序列和功能的单一全球数据库。&lt;br /&gt;
* Uniprot提供亚细胞定位，翻译后修饰&lt;br /&gt;
* Uniprot是包含蛋白质序列，功能信息，论文索引的蛋白质数据库，整合了包括EBI,SIB,PIR三大数据库的资源。&lt;br /&gt;
**EMBL-EBI是指欧洲生物信息学研究所（European Bioinformatics Institute），EMBL的一部分。1982年建立了先进的核苷酸序列数据库（EMBL-DNA），可进行核苷酸序列检索及序列相似性查询。TrEMBL&lt;br /&gt;
**SIB,瑞士生物信息学研究所，维护着ExPASy的服务器,Swissprot&lt;br /&gt;
*** &#039;&#039;&#039;ExPASy&#039;&#039;&#039;是一个集成了多种生物信息学工具和数据库的平台，专门用于蛋白质和蛋白质组学的研究。除了蛋白质相关的数据外，ExPASy还提供了其他生物信息学资源，如代谢通路数据库（KEGG京都代谢通路基因什么什么库）等。其中，Protparam工具是经常使用的功能，它可以根据蛋白质序列估计蛋白质的等电点（pi）、疏水性等特性。&lt;br /&gt;
**** Protscale判断蛋白质序列的疏水性，返回的结果是疏水性曲线，亲水用负值表示,疏水用正值表示。原理是滑动窗口&lt;br /&gt;
**** Prosite数据库是一个用于存储和提供蛋白质序列和结构特征的资源。 主要功能是提供蛋白质的功能和结构信息可以识别功能域和模式，可用于蛋白质家族和亲缘关系的研究，预测蛋白质结构与功能&lt;br /&gt;
** PIR，由美国国家生物医学研究基金会（NBRF）于1984年成立,用于支持基因组学、蛋白质组学和系统生物学研究和科学研究。提供蛋白质数据库和分析工具，包括蛋白质序列数据库 （PSD）。PIR-PSD&lt;br /&gt;
*数据库的关系&lt;br /&gt;
通过INSDC等得到原始数据，处理后存入UniParc。&lt;br /&gt;
&lt;br /&gt;
UniParc作为数据仓库，再分别给UniProtKB，Proteomes，UniRef提供可靠的数据集。&lt;br /&gt;
这里的UniProtKB 由两个子库构成 Swiss-Prot，TrEMBL。&lt;br /&gt;
&lt;br /&gt;
Swiss-Prot 经过人工验证和注释，是高质量的蛋白质注释数据。但人工效率在高速增长的蛋白质数据面前显得极其低效。因此，注释这些数据需要大量时间，为了弥补这一问题。TrEMBL 被建立用于存储由机器自动翻译和预测的蛋白质序列。导致蛋白质数据冗余↑可信度↓。&lt;br /&gt;
&lt;br /&gt;
简而言之，在UniProtKB数据库中Swiss-Prot是由TrEMBL经过手动注释后得到的高质量非冗余数据库，也是我们今后常用的蛋白质数据库之一。&lt;br /&gt;
&lt;br /&gt;
[https://zhuanlan.zhihu.com/p/599641613 感谢知乎qwq]&lt;br /&gt;
&lt;br /&gt;
*Uniprot内部有UniPrac，Uniref，UniProtKB三层，由粗糙到精细列&lt;br /&gt;
** 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。UniParc由于数据冗余，将相同序列合并一条，唯一编号。&lt;br /&gt;
** 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
** 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&amp;lt;TrEMBL和Swissprot热血沸腾的组合技&amp;gt;&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&lt;br /&gt;
== 蛋白质结构数据库 ==&lt;br /&gt;
&lt;br /&gt;
=== 一级结构数据库 ===&lt;br /&gt;
PDB蛋白质结构数据库(Protein Data Bank)是美国Brookhaven国家实验室于1971年创建的，由结构生物信息学研究合作组织(RCSB)维护。&lt;br /&gt;
* PDB数据库以文本文件形式存储分子数据，每个分子形用一个独立的文件。早期的分子文件的文件名后缀为“.pdb”，1997年以后每1种生物大分子对应1组(3个)相关文件分别是：全文文件(后缀为“.full”相当于原来的“.pdb”文件)、书目文件(后缀为“.biblio”)和图形文件(后缀为“.gif”)。&lt;br /&gt;
* PDB数据库是生物大分子的原子坐标和描述蛋白质和其他重要生物大分子相关信息的存储库。结构生物学家使用x 射线晶体学、核磁共振光谱和冷冻电子显微镜等方法来确定分子中每个原子相对于彼此的位置，然后存储这些信息，并由PDB数据库注释并公开发布到档案中。&lt;br /&gt;
**[https://zhuanlan.zhihu.com/p/589697113/]&lt;br /&gt;
[https://www.rcsb.org/]&lt;br /&gt;
&lt;br /&gt;
=== 二级结构数据库 ===&lt;br /&gt;
DSSP工具：DSSP程序是一个二级结构分配（以及更多信息）的数据库，涵盖PDB中的所有蛋白质条目。DSSP也是从PDB条目计算DSSP条目的程序。DSSP并不预测二级结构。&lt;br /&gt;
&lt;br /&gt;
* 根据氢键模式和主链构象，将蛋白质的每个残基分类为特定的二级结构类型。算残基之间的氢键能量，用于确定二级结构的边界。计算每个残基的溶剂可及表面积（ASA），反映其在蛋白质表面的暴露程度。&lt;br /&gt;
* 输入：蛋白质的三维结构文件（通常为PDB格式）。输出：包含每个残基的二级结构类型、氢键信息、溶剂可及性等数据的文本文件。&lt;br /&gt;
&lt;br /&gt;
Pfam数据库重视&#039;&#039;&#039;蛋白质结构域和家族&#039;&#039;&#039;（基于序列同源性），定期通过算法扩展新家族。&lt;br /&gt;
&lt;br /&gt;
* 关注功能相关的蛋白质区域（如结构域），而非完整蛋白质的结构。&lt;br /&gt;
&lt;br /&gt;
* 分类依据：&lt;br /&gt;
** &#039;&#039;&#039;序列相似性&#039;&#039;&#039;，通过隐马尔可夫模型（HMM）比对识别保守区域。&lt;br /&gt;
** 基于多序列比对和进化关系。&lt;br /&gt;
&lt;br /&gt;
* 层次结构：&lt;br /&gt;
** 超家族（Clan）：多个家族在进化或功能上的关联。&lt;br /&gt;
** 家族（Family）：具有显著序列相似性的结构域集合。&lt;br /&gt;
&lt;br /&gt;
CATH数据库提供蛋白质三维结构与分类，关注结构的拓扑和进化起源。&lt;br /&gt;
&lt;br /&gt;
* 蛋白质三维结构的层次化分类（从二级结构到进化关系）以三维结构特征为依据，结合序列和功能信息进行分类&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构组成（如全α、全β、α+β、α/β）。&lt;br /&gt;
*# Architecture（架构）：描述二级结构的空间排布（如β桶、α螺旋束）。&lt;br /&gt;
*# Topology（拓扑）：基于折叠方式和连接性。&lt;br /&gt;
*# Homologous Superfamily&#039;&#039;&#039;（&#039;&#039;&#039;同源超家族）：进化相关的蛋白质。&lt;br /&gt;
&lt;br /&gt;
SCOP数据库分类强调进化同源性，基于结构与进化关系分类，由专家手动分类，强调超家族内的远缘同源关系。&lt;br /&gt;
&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构类型（如全α、全β等）。&lt;br /&gt;
*# Fold（折叠方式）：具有相似拓扑结构的蛋白质。&lt;br /&gt;
*# Superfamily（超家族）：推测具有共同祖先的结构相似蛋白质。&lt;br /&gt;
*# Family（家族）：明确序列同源性的蛋白质集合。&lt;br /&gt;
&lt;br /&gt;
* SCOPe引入自动化分类，但核心仍保留手动注释。&lt;br /&gt;
&amp;lt;这段deepseek写的，我对着笔记查了一下&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4870</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4870"/>
		<updated>2025-03-16T13:40:06Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* 二级结构数据库 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
国际核苷酸序列数据库协作 （INSDC），包含NLM-NCBI(美国）,ENA(欧洲,EMBL与EBI参与),DDBJ(日本),&lt;br /&gt;
&lt;br /&gt;
其创始成员是信息和系统研究组织、日本国家遗传学研究所 （ROIS-NIG）、欧洲分子生物学实验室 - 欧洲生物信息学研究所 （EMBL-EBI） 和美国国立卫生研究院的一个组成部分,国家医学图书馆-国家生物技术信息中心 （NLM-NCBI）。&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
PubMed诞生于1996年。最常用的文摘型数据库。其收录范围不仅包括Medline，还有大部分PMC和NIH基金资助作者的文献，NCBI书籍等。PubMed还提供链接到文献全文所在网站的全文链接。早期 PubMed 数据库主要的任务，是将 Mesh 目录(MEDlINE的早期目录，主题词表)中收录的医学主题与大量有关医学研究的文献相匹配。这意味着，PubMed最早的发布时间应该是在 1971 年，也就是 MEDLINE 数据库第一次正式发布的时间。&lt;br /&gt;
&lt;br /&gt;
MEDLINE始建于1966年（追溯收录至1946年），是NLM的期刊文献记录数据库。1983年，MEDLINE推出电子版，网上数据每日更新，光盘版每月更新。MEDLINE有严格的文献选择委员会LSTRC进行选刊。目前MEDLINE的文献都收录在PubMed中。&lt;br /&gt;
&lt;br /&gt;
PMC全称为PubMed Central，建立于2000年，由NCBI进行管理，是可以免费获取全文的生物医学和生命科学全文数据库，保存了NLM收录印刷杂志的电子副本。PMC的部分bookreview内容没有收录于PubMed。&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签库&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== EMBL（European Molecular Biology Laboratory）欧洲分子生物学实验室 ==&lt;br /&gt;
总部位于德国海德堡，1974年由欧洲14个国家加上亚洲的以色列共同发起建立，现在由欧洲29个成员国政府支持组成，目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。&lt;br /&gt;
&lt;br /&gt;
[https://www.embl.org www.embl.org]&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成.2002 年，PIR 与其国际合作伙伴 EBI（欧洲生物信息学研究所）和 SIB（瑞士生物信息学研究所）一起获得了 NIH 的资助，创建了 UniProt。 通过统一 PIR-PSD、Swiss-Prot 和 TrEMBL 数据库，实现蛋白质序列和功能的单一全球数据库。&lt;br /&gt;
* Uniprot提供亚细胞定位，翻译后修饰&lt;br /&gt;
* Uniprot是包含蛋白质序列，功能信息，论文索引的蛋白质数据库，整合了包括EBI,SIB,PIR三大数据库的资源。&lt;br /&gt;
**EMBL-EBI是指欧洲生物信息学研究所（European Bioinformatics Institute），EMBL的一部分。1982年建立了先进的核苷酸序列数据库（EMBL-DNA），可进行核苷酸序列检索及序列相似性查询。TrEMBL&lt;br /&gt;
**SIB,瑞士生物信息学研究所，维护着ExPASy的服务器,Swissprot&lt;br /&gt;
*** &#039;&#039;&#039;ExPASy&#039;&#039;&#039;是一个集成了多种生物信息学工具和数据库的平台，专门用于蛋白质和蛋白质组学的研究。除了蛋白质相关的数据外，ExPASy还提供了其他生物信息学资源，如代谢通路数据库（KEGG）等。其中，Protparam工具是经常使用的功能，它可以根据蛋白质序列估计蛋白质的等电点（pi）、疏水性等特性。&lt;br /&gt;
** PIR，由美国国家生物医学研究基金会（NBRF）于1984年成立,用于支持基因组学、蛋白质组学和系统生物学研究和科学研究。提供蛋白质数据库和分析工具，包括蛋白质序列数据库 （PSD）。PIR-PSD&lt;br /&gt;
*数据库的关系&lt;br /&gt;
通过INSDC等得到原始数据，处理后存入UniParc。&lt;br /&gt;
&lt;br /&gt;
UniParc作为数据仓库，再分别给UniProtKB，Proteomes，UniRef提供可靠的数据集。&lt;br /&gt;
这里的UniProtKB 由两个子库构成 Swiss-Prot，TrEMBL。&lt;br /&gt;
&lt;br /&gt;
Swiss-Prot 经过人工验证和注释，是高质量的蛋白质注释数据。但人工效率在高速增长的蛋白质数据面前显得极其低效。因此，注释这些数据需要大量时间，为了弥补这一问题。TrEMBL 被建立用于存储由机器自动翻译和预测的蛋白质序列。导致蛋白质数据冗余↑可信度↓。&lt;br /&gt;
&lt;br /&gt;
简而言之，在UniProtKB数据库中Swiss-Prot是由TrEMBL经过手动注释后得到的高质量非冗余数据库，也是我们今后常用的蛋白质数据库之一。&lt;br /&gt;
&lt;br /&gt;
[https://zhuanlan.zhihu.com/p/599641613 感谢知乎qwq]&lt;br /&gt;
&lt;br /&gt;
** 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。UniParc由于数据冗余，将相同序列合并一条，唯一编号。&lt;br /&gt;
** 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
** 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&lt;br /&gt;
== 蛋白质结构数据库 ==&lt;br /&gt;
&lt;br /&gt;
=== 一级结构数据库 ===&lt;br /&gt;
PDB蛋白质结构数据库(Protein Data Bank)是美国Brookhaven国家实验室于1971年创建的，由结构生物信息学研究合作组织(RCSB)维护。&lt;br /&gt;
* PDB数据库以文本文件形式存储分子数据，每个分子形用一个独立的文件。早期的分子文件的文件名后缀为“.pdb”，1997年以后每1种生物大分子对应1组(3个)相关文件分别是：全文文件(后缀为“.full”相当于原来的“.pdb”文件)、书目文件(后缀为“.biblio”)和图形文件(后缀为“.gif”)。&lt;br /&gt;
* PDB数据库是生物大分子的原子坐标和描述蛋白质和其他重要生物大分子相关信息的存储库。结构生物学家使用x 射线晶体学、核磁共振光谱和冷冻电子显微镜等方法来确定分子中每个原子相对于彼此的位置，然后存储这些信息，并由PDB数据库注释并公开发布到档案中。&lt;br /&gt;
**[https://zhuanlan.zhihu.com/p/589697113/]&lt;br /&gt;
[https://www.rcsb.org/]&lt;br /&gt;
&lt;br /&gt;
=== 二级结构数据库 ===&lt;br /&gt;
DSSP工具：DSSP程序是一个二级结构分配（以及更多信息）的数据库，涵盖PDB中的所有蛋白质条目。DSSP也是从PDB条目计算DSSP条目的程序。DSSP并不预测二级结构。&lt;br /&gt;
&lt;br /&gt;
* 根据氢键模式和主链构象，将蛋白质的每个残基分类为特定的二级结构类型。算残基之间的氢键能量，用于确定二级结构的边界。计算每个残基的溶剂可及表面积（ASA），反映其在蛋白质表面的暴露程度。&lt;br /&gt;
* 输入：蛋白质的三维结构文件（通常为PDB格式）。输出：包含每个残基的二级结构类型、氢键信息、溶剂可及性等数据的文本文件。&lt;br /&gt;
&lt;br /&gt;
Pfam数据库重视&#039;&#039;&#039;蛋白质结构域和家族&#039;&#039;&#039;（基于序列同源性），定期通过算法扩展新家族。&lt;br /&gt;
&lt;br /&gt;
* 关注功能相关的蛋白质区域（如结构域），而非完整蛋白质的结构。&lt;br /&gt;
&lt;br /&gt;
* 分类依据：&lt;br /&gt;
** &#039;&#039;&#039;序列相似性&#039;&#039;&#039;，通过隐马尔可夫模型（HMM）比对识别保守区域。&lt;br /&gt;
** 基于多序列比对和进化关系。&lt;br /&gt;
&lt;br /&gt;
* 层次结构：&lt;br /&gt;
** 超家族（Clan）：多个家族在进化或功能上的关联。&lt;br /&gt;
** 家族（Family）：具有显著序列相似性的结构域集合。&lt;br /&gt;
&lt;br /&gt;
CATH数据库提供蛋白质三维结构与分类，关注结构的拓扑和进化起源。&lt;br /&gt;
&lt;br /&gt;
* 蛋白质三维结构的层次化分类（从二级结构到进化关系）以三维结构特征为依据，结合序列和功能信息进行分类&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构组成（如全α、全β、α+β、α/β）。&lt;br /&gt;
*# Architecture（架构）：描述二级结构的空间排布（如β桶、α螺旋束）。&lt;br /&gt;
*# Topology（拓扑）：基于折叠方式和连接性。&lt;br /&gt;
*# Homologous Superfamily&#039;&#039;&#039;（&#039;&#039;&#039;同源超家族）：进化相关的蛋白质。&lt;br /&gt;
&lt;br /&gt;
SCOP数据库分类强调进化同源性，基于结构与进化关系分类，由专家手动分类，强调超家族内的远缘同源关系。&lt;br /&gt;
&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构类型（如全α、全β等）。&lt;br /&gt;
*# Fold（折叠方式）：具有相似拓扑结构的蛋白质。&lt;br /&gt;
*# Superfamily（超家族）：推测具有共同祖先的结构相似蛋白质。&lt;br /&gt;
*# Family（家族）：明确序列同源性的蛋白质集合。&lt;br /&gt;
&lt;br /&gt;
* SCOPe引入自动化分类，但核心仍保留手动注释。&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4821</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4821"/>
		<updated>2025-03-15T09:43:47Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* 蛋白质结构数据库 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
国际核苷酸序列数据库协作 （INSDC），包含NLM-NCBI(美国）,ENA(欧洲,EMBL与EBI参与),DDBJ(日本),&lt;br /&gt;
&lt;br /&gt;
其创始成员是信息和系统研究组织、日本国家遗传学研究所 （ROIS-NIG）、欧洲分子生物学实验室 - 欧洲生物信息学研究所 （EMBL-EBI） 和美国国立卫生研究院的一个组成部分,国家医学图书馆-国家生物技术信息中心 （NLM-NCBI）。&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
PubMed诞生于1996年。最常用的文摘型数据库。其收录范围不仅包括Medline，还有大部分PMC和NIH基金资助作者的文献，NCBI书籍等。PubMed还提供链接到文献全文所在网站的全文链接。早期 PubMed 数据库主要的任务，是将 Mesh 目录(MEDlINE的早期目录，主题词表)中收录的医学主题与大量有关医学研究的文献相匹配。这意味着，PubMed最早的发布时间应该是在 1971 年，也就是 MEDLINE 数据库第一次正式发布的时间。&lt;br /&gt;
&lt;br /&gt;
MEDLINE始建于1966年（追溯收录至1946年），是NLM的期刊文献记录数据库。1983年，MEDLINE推出电子版，网上数据每日更新，光盘版每月更新。MEDLINE有严格的文献选择委员会LSTRC进行选刊。目前MEDLINE的文献都收录在PubMed中。&lt;br /&gt;
&lt;br /&gt;
PMC全称为PubMed Central，建立于2000年，由NCBI进行管理，是可以免费获取全文的生物医学和生命科学全文数据库，保存了NLM收录印刷杂志的电子副本。PMC的部分bookreview内容没有收录于PubMed。&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签库&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== EMBL（European Molecular Biology Laboratory）欧洲分子生物学实验室 ==&lt;br /&gt;
总部位于德国海德堡，1974年由欧洲14个国家加上亚洲的以色列共同发起建立，现在由欧洲29个成员国政府支持组成，目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。&lt;br /&gt;
&lt;br /&gt;
[https://www.embl.org www.embl.org]&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成.2002 年，PIR 与其国际合作伙伴 EBI（欧洲生物信息学研究所）和 SIB（瑞士生物信息学研究所）一起获得了 NIH 的资助，创建了 UniProt。 通过统一 PIR-PSD、Swiss-Prot 和 TrEMBL 数据库，实现蛋白质序列和功能的单一全球数据库。&lt;br /&gt;
* Uniprot提供亚细胞定位，翻译后修饰&lt;br /&gt;
* Uniprot是包含蛋白质序列，功能信息，论文索引的蛋白质数据库，整合了包括EBI,SIB,PIR三大数据库的资源。&lt;br /&gt;
**EMBL-EBI是指欧洲生物信息学研究所（European Bioinformatics Institute），EMBL的一部分。1982年建立了先进的核苷酸序列数据库（EMBL-DNA），可进行核苷酸序列检索及序列相似性查询。TrEMBL&lt;br /&gt;
**SIB,瑞士生物信息学研究所，维护着ExPASy的服务器,Swissprot&lt;br /&gt;
*** &#039;&#039;&#039;ExPASy&#039;&#039;&#039;是一个集成了多种生物信息学工具和数据库的平台，专门用于蛋白质和蛋白质组学的研究。除了蛋白质相关的数据外，ExPASy还提供了其他生物信息学资源，如代谢通路数据库（KEGG）等。其中，Protparam工具是经常使用的功能，它可以根据蛋白质序列估计蛋白质的等电点（pi）、疏水性等特性。&lt;br /&gt;
** PIR，由美国国家生物医学研究基金会（NBRF）于1984年成立,用于支持基因组学、蛋白质组学和系统生物学研究和科学研究。提供蛋白质数据库和分析工具，包括蛋白质序列数据库 （PSD）。PIR-PSD&lt;br /&gt;
*数据库的关系&lt;br /&gt;
通过INSDC等得到原始数据，处理后存入UniParc。&lt;br /&gt;
&lt;br /&gt;
UniParc作为数据仓库，再分别给UniProtKB，Proteomes，UniRef提供可靠的数据集。&lt;br /&gt;
这里的UniProtKB 由两个子库构成 Swiss-Prot，TrEMBL。&lt;br /&gt;
&lt;br /&gt;
Swiss-Prot 经过人工验证和注释，是高质量的蛋白质注释数据。但人工效率在高速增长的蛋白质数据面前显得极其低效。因此，注释这些数据需要大量时间，为了弥补这一问题。TrEMBL 被建立用于存储由机器自动翻译和预测的蛋白质序列。导致蛋白质数据冗余↑可信度↓。&lt;br /&gt;
&lt;br /&gt;
简而言之，在UniProtKB数据库中Swiss-Prot是由TrEMBL经过手动注释后得到的高质量非冗余数据库，也是我们今后常用的蛋白质数据库之一。&lt;br /&gt;
&lt;br /&gt;
[https://zhuanlan.zhihu.com/p/599641613 感谢知乎qwq]&lt;br /&gt;
&lt;br /&gt;
** 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。UniParc由于数据冗余，将相同序列合并一条，唯一编号。&lt;br /&gt;
** 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
** 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&lt;br /&gt;
== 蛋白质结构数据库 ==&lt;br /&gt;
&lt;br /&gt;
=== 一级结构数据库 ===&lt;br /&gt;
PDB蛋白质结构数据库(Protein Data Bank)是美国Brookhaven国家实验室于1971年创建的，由结构生物信息学研究合作组织(RCSB)维护。&lt;br /&gt;
* PDB数据库以文本文件形式存储分子数据，每个分子形用一个独立的文件。早期的分子文件的文件名后缀为“.pdb”，1997年以后每1种生物大分子对应1组(3个)相关文件分别是：全文文件(后缀为“.full”相当于原来的“.pdb”文件)、书目文件(后缀为“.biblio”)和图形文件(后缀为“.gif”)。&lt;br /&gt;
* PDB数据库是生物大分子的原子坐标和描述蛋白质和其他重要生物大分子相关信息的存储库。结构生物学家使用x 射线晶体学、核磁共振光谱和冷冻电子显微镜等方法来确定分子中每个原子相对于彼此的位置，然后存储这些信息，并由PDB数据库注释并公开发布到档案中。&lt;br /&gt;
**[https://zhuanlan.zhihu.com/p/589697113/]&lt;br /&gt;
[https://www.rcsb.org/]&lt;br /&gt;
&lt;br /&gt;
=== 二级结构数据库 ===&lt;br /&gt;
Pfam数据库重视&#039;&#039;&#039;蛋白质结构域和家族&#039;&#039;&#039;（基于序列同源性），定期通过算法扩展新家族。&lt;br /&gt;
&lt;br /&gt;
* 关注功能相关的蛋白质区域（如结构域），而非完整蛋白质的结构。&lt;br /&gt;
&lt;br /&gt;
* 分类依据：&lt;br /&gt;
** &#039;&#039;&#039;序列相似性&#039;&#039;&#039;，通过隐马尔可夫模型（HMM）比对识别保守区域。&lt;br /&gt;
** 基于多序列比对和进化关系。&lt;br /&gt;
&lt;br /&gt;
* 层次结构：&lt;br /&gt;
** 超家族（Clan）：多个家族在进化或功能上的关联。&lt;br /&gt;
** 家族（Family）：具有显著序列相似性的结构域集合。&lt;br /&gt;
&lt;br /&gt;
CATH数据库提供蛋白质三维结构与分类，关注结构的拓扑和进化起源。&lt;br /&gt;
&lt;br /&gt;
* 蛋白质三维结构的层次化分类（从二级结构到进化关系）以三维结构特征为依据，结合序列和功能信息进行分类&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构组成（如全α、全β、α+β、α/β）。&lt;br /&gt;
*# Architecture（架构）：描述二级结构的空间排布（如β桶、α螺旋束）。&lt;br /&gt;
*# Topology（拓扑）：基于折叠方式和连接性。&lt;br /&gt;
*# Homologous Superfamily&#039;&#039;&#039;（&#039;&#039;&#039;同源超家族）：进化相关的蛋白质。&lt;br /&gt;
&lt;br /&gt;
SCOP数据库分类强调进化同源性，基于结构与进化关系分类，由专家手动分类，强调超家族内的远缘同源关系。&lt;br /&gt;
&lt;br /&gt;
* 分类层次：&lt;br /&gt;
*# Class（类别）：基于二级结构类型（如全α、全β等）。&lt;br /&gt;
*# Fold（折叠方式）：具有相似拓扑结构的蛋白质。&lt;br /&gt;
*# Superfamily（超家族）：推测具有共同祖先的结构相似蛋白质。&lt;br /&gt;
*# Family（家族）：明确序列同源性的蛋白质集合。&lt;br /&gt;
&lt;br /&gt;
* SCOPe引入自动化分类，但核心仍保留手动注释。&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4820</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4820"/>
		<updated>2025-03-15T09:26:15Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* 蛋白质结构数据库 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
国际核苷酸序列数据库协作 （INSDC），包含NLM-NCBI(美国）,ENA(欧洲,EMBL与EBI参与),DDBJ(日本),&lt;br /&gt;
&lt;br /&gt;
其创始成员是信息和系统研究组织、日本国家遗传学研究所 （ROIS-NIG）、欧洲分子生物学实验室 - 欧洲生物信息学研究所 （EMBL-EBI） 和美国国立卫生研究院的一个组成部分,国家医学图书馆-国家生物技术信息中心 （NLM-NCBI）。&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
PubMed诞生于1996年。最常用的文摘型数据库。其收录范围不仅包括Medline，还有大部分PMC和NIH基金资助作者的文献，NCBI书籍等。PubMed还提供链接到文献全文所在网站的全文链接。早期 PubMed 数据库主要的任务，是将 Mesh 目录(MEDlINE的早期目录，主题词表)中收录的医学主题与大量有关医学研究的文献相匹配。这意味着，PubMed最早的发布时间应该是在 1971 年，也就是 MEDLINE 数据库第一次正式发布的时间。&lt;br /&gt;
&lt;br /&gt;
MEDLINE始建于1966年（追溯收录至1946年），是NLM的期刊文献记录数据库。1983年，MEDLINE推出电子版，网上数据每日更新，光盘版每月更新。MEDLINE有严格的文献选择委员会LSTRC进行选刊。目前MEDLINE的文献都收录在PubMed中。&lt;br /&gt;
&lt;br /&gt;
PMC全称为PubMed Central，建立于2000年，由NCBI进行管理，是可以免费获取全文的生物医学和生命科学全文数据库，保存了NLM收录印刷杂志的电子副本。PMC的部分bookreview内容没有收录于PubMed。&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签库&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== EMBL（European Molecular Biology Laboratory）欧洲分子生物学实验室 ==&lt;br /&gt;
总部位于德国海德堡，1974年由欧洲14个国家加上亚洲的以色列共同发起建立，现在由欧洲29个成员国政府支持组成，目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。&lt;br /&gt;
&lt;br /&gt;
[https://www.embl.org www.embl.org]&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成.2002 年，PIR 与其国际合作伙伴 EBI（欧洲生物信息学研究所）和 SIB（瑞士生物信息学研究所）一起获得了 NIH 的资助，创建了 UniProt。 通过统一 PIR-PSD、Swiss-Prot 和 TrEMBL 数据库，实现蛋白质序列和功能的单一全球数据库。&lt;br /&gt;
* Uniprot提供亚细胞定位，翻译后修饰&lt;br /&gt;
* Uniprot是包含蛋白质序列，功能信息，论文索引的蛋白质数据库，整合了包括EBI,SIB,PIR三大数据库的资源。&lt;br /&gt;
**EMBL-EBI是指欧洲生物信息学研究所（European Bioinformatics Institute），EMBL的一部分。1982年建立了先进的核苷酸序列数据库（EMBL-DNA），可进行核苷酸序列检索及序列相似性查询。TrEMBL&lt;br /&gt;
**SIB,瑞士生物信息学研究所，维护着ExPASy的服务器,Swissprot&lt;br /&gt;
*** &#039;&#039;&#039;ExPASy&#039;&#039;&#039;是一个集成了多种生物信息学工具和数据库的平台，专门用于蛋白质和蛋白质组学的研究。除了蛋白质相关的数据外，ExPASy还提供了其他生物信息学资源，如代谢通路数据库（KEGG）等。其中，Protparam工具是经常使用的功能，它可以根据蛋白质序列估计蛋白质的等电点（pi）、疏水性等特性。&lt;br /&gt;
** PIR，由美国国家生物医学研究基金会（NBRF）于1984年成立,用于支持基因组学、蛋白质组学和系统生物学研究和科学研究。提供蛋白质数据库和分析工具，包括蛋白质序列数据库 （PSD）。PIR-PSD&lt;br /&gt;
*数据库的关系&lt;br /&gt;
通过INSDC等得到原始数据，处理后存入UniParc。&lt;br /&gt;
&lt;br /&gt;
UniParc作为数据仓库，再分别给UniProtKB，Proteomes，UniRef提供可靠的数据集。&lt;br /&gt;
这里的UniProtKB 由两个子库构成 Swiss-Prot，TrEMBL。&lt;br /&gt;
&lt;br /&gt;
Swiss-Prot 经过人工验证和注释，是高质量的蛋白质注释数据。但人工效率在高速增长的蛋白质数据面前显得极其低效。因此，注释这些数据需要大量时间，为了弥补这一问题。TrEMBL 被建立用于存储由机器自动翻译和预测的蛋白质序列。导致蛋白质数据冗余↑可信度↓。&lt;br /&gt;
&lt;br /&gt;
简而言之，在UniProtKB数据库中Swiss-Prot是由TrEMBL经过手动注释后得到的高质量非冗余数据库，也是我们今后常用的蛋白质数据库之一。&lt;br /&gt;
&lt;br /&gt;
[https://zhuanlan.zhihu.com/p/599641613 感谢知乎qwq]&lt;br /&gt;
&lt;br /&gt;
** 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。UniParc由于数据冗余，将相同序列合并一条，唯一编号。&lt;br /&gt;
** 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
** 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&lt;br /&gt;
== 蛋白质结构数据库 ==&lt;br /&gt;
&lt;br /&gt;
=== 一级结构数据库 ===&lt;br /&gt;
&lt;br /&gt;
* PDB蛋白质结构数据库(Protein Data Bank)是美国Brookhaven国家实验室于1971年创建的，由结构生物信息学研究合作组织(RCSB)维护。&lt;br /&gt;
** PDB数据库以文本文件形式存储分子数据，每个分子形用一个独立的文件。早期的分子文件的文件名后缀为“.pdb”，1997年以后每1种生物大分子对应1组(3个)相关文件分别是：全文文件(后缀为“.full”相当于原来的“.pdb”文件)、书目文件(后缀为“.biblio”)和图形文件(后缀为“.gif”)。&lt;br /&gt;
** PDB数据库是生物大分子的原子坐标和描述蛋白质和其他重要生物大分子相关信息的存储库。结构生物学家使用x 射线晶体学、核磁共振光谱和冷冻电子显微镜等方法来确定分子中每个原子相对于彼此的位置，然后存储这些信息，并由PDB数据库注释并公开发布到档案中。&lt;br /&gt;
***[https://https://zhuanlan.zhihu.com/p/589697113/资料来源。]&lt;br /&gt;
[https://www.rcsb.org/pdb本站]&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4819</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4819"/>
		<updated>2025-03-15T09:24:46Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* 蛋白质结构数据库 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
国际核苷酸序列数据库协作 （INSDC），包含NLM-NCBI(美国）,ENA(欧洲,EMBL与EBI参与),DDBJ(日本),&lt;br /&gt;
&lt;br /&gt;
其创始成员是信息和系统研究组织、日本国家遗传学研究所 （ROIS-NIG）、欧洲分子生物学实验室 - 欧洲生物信息学研究所 （EMBL-EBI） 和美国国立卫生研究院的一个组成部分,国家医学图书馆-国家生物技术信息中心 （NLM-NCBI）。&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
PubMed诞生于1996年。最常用的文摘型数据库。其收录范围不仅包括Medline，还有大部分PMC和NIH基金资助作者的文献，NCBI书籍等。PubMed还提供链接到文献全文所在网站的全文链接。早期 PubMed 数据库主要的任务，是将 Mesh 目录(MEDlINE的早期目录，主题词表)中收录的医学主题与大量有关医学研究的文献相匹配。这意味着，PubMed最早的发布时间应该是在 1971 年，也就是 MEDLINE 数据库第一次正式发布的时间。&lt;br /&gt;
&lt;br /&gt;
MEDLINE始建于1966年（追溯收录至1946年），是NLM的期刊文献记录数据库。1983年，MEDLINE推出电子版，网上数据每日更新，光盘版每月更新。MEDLINE有严格的文献选择委员会LSTRC进行选刊。目前MEDLINE的文献都收录在PubMed中。&lt;br /&gt;
&lt;br /&gt;
PMC全称为PubMed Central，建立于2000年，由NCBI进行管理，是可以免费获取全文的生物医学和生命科学全文数据库，保存了NLM收录印刷杂志的电子副本。PMC的部分bookreview内容没有收录于PubMed。&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签库&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== EMBL（European Molecular Biology Laboratory）欧洲分子生物学实验室 ==&lt;br /&gt;
总部位于德国海德堡，1974年由欧洲14个国家加上亚洲的以色列共同发起建立，现在由欧洲29个成员国政府支持组成，目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。&lt;br /&gt;
&lt;br /&gt;
[https://www.embl.org www.embl.org]&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成.2002 年，PIR 与其国际合作伙伴 EBI（欧洲生物信息学研究所）和 SIB（瑞士生物信息学研究所）一起获得了 NIH 的资助，创建了 UniProt。 通过统一 PIR-PSD、Swiss-Prot 和 TrEMBL 数据库，实现蛋白质序列和功能的单一全球数据库。&lt;br /&gt;
* Uniprot提供亚细胞定位，翻译后修饰&lt;br /&gt;
* Uniprot是包含蛋白质序列，功能信息，论文索引的蛋白质数据库，整合了包括EBI,SIB,PIR三大数据库的资源。&lt;br /&gt;
**EMBL-EBI是指欧洲生物信息学研究所（European Bioinformatics Institute），EMBL的一部分。1982年建立了先进的核苷酸序列数据库（EMBL-DNA），可进行核苷酸序列检索及序列相似性查询。TrEMBL&lt;br /&gt;
**SIB,瑞士生物信息学研究所，维护着ExPASy的服务器,Swissprot&lt;br /&gt;
*** &#039;&#039;&#039;ExPASy&#039;&#039;&#039;是一个集成了多种生物信息学工具和数据库的平台，专门用于蛋白质和蛋白质组学的研究。除了蛋白质相关的数据外，ExPASy还提供了其他生物信息学资源，如代谢通路数据库（KEGG）等。其中，Protparam工具是经常使用的功能，它可以根据蛋白质序列估计蛋白质的等电点（pi）、疏水性等特性。&lt;br /&gt;
** PIR，由美国国家生物医学研究基金会（NBRF）于1984年成立,用于支持基因组学、蛋白质组学和系统生物学研究和科学研究。提供蛋白质数据库和分析工具，包括蛋白质序列数据库 （PSD）。PIR-PSD&lt;br /&gt;
*数据库的关系&lt;br /&gt;
通过INSDC等得到原始数据，处理后存入UniParc。&lt;br /&gt;
&lt;br /&gt;
UniParc作为数据仓库，再分别给UniProtKB，Proteomes，UniRef提供可靠的数据集。&lt;br /&gt;
这里的UniProtKB 由两个子库构成 Swiss-Prot，TrEMBL。&lt;br /&gt;
&lt;br /&gt;
Swiss-Prot 经过人工验证和注释，是高质量的蛋白质注释数据。但人工效率在高速增长的蛋白质数据面前显得极其低效。因此，注释这些数据需要大量时间，为了弥补这一问题。TrEMBL 被建立用于存储由机器自动翻译和预测的蛋白质序列。导致蛋白质数据冗余↑可信度↓。&lt;br /&gt;
&lt;br /&gt;
简而言之，在UniProtKB数据库中Swiss-Prot是由TrEMBL经过手动注释后得到的高质量非冗余数据库，也是我们今后常用的蛋白质数据库之一。&lt;br /&gt;
&lt;br /&gt;
[https://zhuanlan.zhihu.com/p/599641613 感谢知乎qwq]&lt;br /&gt;
&lt;br /&gt;
** 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。UniParc由于数据冗余，将相同序列合并一条，唯一编号。&lt;br /&gt;
** 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
** 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&lt;br /&gt;
== 蛋白质结构数据库 ==&lt;br /&gt;
&lt;br /&gt;
=== 一级结构数据库 ===&lt;br /&gt;
&lt;br /&gt;
* PDB蛋白质结构数据库(Protein Data Bank)是美国Brookhaven国家实验室于1971年创建的，由结构生物信息学研究合作组织(RCSB)维护。&lt;br /&gt;
** PDB数据库以文本文件形式存储分子数据，每个分子形用一个独立的文件。早期的分子文件的文件名后缀为“.pdb”，1997年以后每1种生物大分子对应1组(3个)相关文件分别是：全文文件(后缀为“.full”相当于原来的“.pdb”文件)、书目文件(后缀为“.biblio”)和图形文件(后缀为“.gif”)。&lt;br /&gt;
** PDB数据库是生物大分子的原子坐标和描述蛋白质和其他重要生物大分子相关信息的存储库。结构生物学家使用x 射线晶体学、核磁共振光谱和冷冻电子显微镜等方法来确定分子中每个原子相对于彼此的位置，然后存储这些信息，并由PDB数据库注释并公开发布到档案中。&lt;br /&gt;
***&amp;lt;ref&amp;gt;[https://https://zhuanlan.zhihu.com/p/589697113/ ]，资料来源。&amp;lt;/ref&amp;gt;&lt;br /&gt;
&amp;lt;ref&amp;gt;[https://www.rcsb.org/ ]，pdb本站。&amp;lt;/ref&amp;gt;&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4818</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4818"/>
		<updated>2025-03-15T09:22:19Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* UniProt：联合蛋白质序列数据库 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
国际核苷酸序列数据库协作 （INSDC），包含NLM-NCBI(美国）,ENA(欧洲,EMBL与EBI参与),DDBJ(日本),&lt;br /&gt;
&lt;br /&gt;
其创始成员是信息和系统研究组织、日本国家遗传学研究所 （ROIS-NIG）、欧洲分子生物学实验室 - 欧洲生物信息学研究所 （EMBL-EBI） 和美国国立卫生研究院的一个组成部分,国家医学图书馆-国家生物技术信息中心 （NLM-NCBI）。&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
PubMed诞生于1996年。最常用的文摘型数据库。其收录范围不仅包括Medline，还有大部分PMC和NIH基金资助作者的文献，NCBI书籍等。PubMed还提供链接到文献全文所在网站的全文链接。早期 PubMed 数据库主要的任务，是将 Mesh 目录(MEDlINE的早期目录，主题词表)中收录的医学主题与大量有关医学研究的文献相匹配。这意味着，PubMed最早的发布时间应该是在 1971 年，也就是 MEDLINE 数据库第一次正式发布的时间。&lt;br /&gt;
&lt;br /&gt;
MEDLINE始建于1966年（追溯收录至1946年），是NLM的期刊文献记录数据库。1983年，MEDLINE推出电子版，网上数据每日更新，光盘版每月更新。MEDLINE有严格的文献选择委员会LSTRC进行选刊。目前MEDLINE的文献都收录在PubMed中。&lt;br /&gt;
&lt;br /&gt;
PMC全称为PubMed Central，建立于2000年，由NCBI进行管理，是可以免费获取全文的生物医学和生命科学全文数据库，保存了NLM收录印刷杂志的电子副本。PMC的部分bookreview内容没有收录于PubMed。&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签库&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== EMBL（European Molecular Biology Laboratory）欧洲分子生物学实验室 ==&lt;br /&gt;
总部位于德国海德堡，1974年由欧洲14个国家加上亚洲的以色列共同发起建立，现在由欧洲29个成员国政府支持组成，目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。&lt;br /&gt;
&lt;br /&gt;
[https://www.embl.org www.embl.org]&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成.2002 年，PIR 与其国际合作伙伴 EBI（欧洲生物信息学研究所）和 SIB（瑞士生物信息学研究所）一起获得了 NIH 的资助，创建了 UniProt。 通过统一 PIR-PSD、Swiss-Prot 和 TrEMBL 数据库，实现蛋白质序列和功能的单一全球数据库。&lt;br /&gt;
* Uniprot提供亚细胞定位，翻译后修饰&lt;br /&gt;
* Uniprot是包含蛋白质序列，功能信息，论文索引的蛋白质数据库，整合了包括EBI,SIB,PIR三大数据库的资源。&lt;br /&gt;
**EMBL-EBI是指欧洲生物信息学研究所（European Bioinformatics Institute），EMBL的一部分。1982年建立了先进的核苷酸序列数据库（EMBL-DNA），可进行核苷酸序列检索及序列相似性查询。TrEMBL&lt;br /&gt;
**SIB,瑞士生物信息学研究所，维护着ExPASy的服务器,Swissprot&lt;br /&gt;
*** &#039;&#039;&#039;ExPASy&#039;&#039;&#039;是一个集成了多种生物信息学工具和数据库的平台，专门用于蛋白质和蛋白质组学的研究。除了蛋白质相关的数据外，ExPASy还提供了其他生物信息学资源，如代谢通路数据库（KEGG）等。其中，Protparam工具是经常使用的功能，它可以根据蛋白质序列估计蛋白质的等电点（pi）、疏水性等特性。&lt;br /&gt;
** PIR，由美国国家生物医学研究基金会（NBRF）于1984年成立,用于支持基因组学、蛋白质组学和系统生物学研究和科学研究。提供蛋白质数据库和分析工具，包括蛋白质序列数据库 （PSD）。PIR-PSD&lt;br /&gt;
*数据库的关系&lt;br /&gt;
通过INSDC等得到原始数据，处理后存入UniParc。&lt;br /&gt;
&lt;br /&gt;
UniParc作为数据仓库，再分别给UniProtKB，Proteomes，UniRef提供可靠的数据集。&lt;br /&gt;
这里的UniProtKB 由两个子库构成 Swiss-Prot，TrEMBL。&lt;br /&gt;
&lt;br /&gt;
Swiss-Prot 经过人工验证和注释，是高质量的蛋白质注释数据。但人工效率在高速增长的蛋白质数据面前显得极其低效。因此，注释这些数据需要大量时间，为了弥补这一问题。TrEMBL 被建立用于存储由机器自动翻译和预测的蛋白质序列。导致蛋白质数据冗余↑可信度↓。&lt;br /&gt;
&lt;br /&gt;
简而言之，在UniProtKB数据库中Swiss-Prot是由TrEMBL经过手动注释后得到的高质量非冗余数据库，也是我们今后常用的蛋白质数据库之一。&lt;br /&gt;
&lt;br /&gt;
[https://zhuanlan.zhihu.com/p/599641613 感谢知乎qwq]&lt;br /&gt;
&lt;br /&gt;
** 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。UniParc由于数据冗余，将相同序列合并一条，唯一编号。&lt;br /&gt;
** 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
** 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&lt;br /&gt;
== 蛋白质结构数据库 ==&lt;br /&gt;
&lt;br /&gt;
=== 一级结构数据库 ===&lt;br /&gt;
&lt;br /&gt;
* PDB蛋白质结构数据库(Protein Data Bank)是美国Brookhaven国家实验室于1971年创建的，由结构生物信息学研究合作组织(RCSB)维护。&lt;br /&gt;
** PDB数据库以文本文件形式存储分子数据，每个分子形用一个独立的文件。早期的分子文件的文件名后缀为“.pdb”，1997年以后每1种生物大分子对应1组(3个)相关文件分别是：全文文件(后缀为“.full”相当于原来的“.pdb”文件)、书目文件(后缀为“.biblio”)和图形文件(后缀为“.gif”)。&lt;br /&gt;
** PDB数据库是生物大分子的原子坐标和描述蛋白质和其他重要生物大分子相关信息的存储库。结构生物学家使用x 射线晶体学、核磁共振光谱和冷冻电子显微镜等方法来确定分子中每个原子相对于彼此的位置，然后存储这些信息，并由PDB数据库注释并公开发布到档案中。&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4817</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4817"/>
		<updated>2025-03-15T08:54:20Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* UniProt：联合蛋白质序列数据库 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
国际核苷酸序列数据库协作 （INSDC），包含NLM-NCBI(美国）,ENA(欧洲,EMBL与EBI参与),DDBJ(日本),&lt;br /&gt;
&lt;br /&gt;
其创始成员是信息和系统研究组织、日本国家遗传学研究所 （ROIS-NIG）、欧洲分子生物学实验室 - 欧洲生物信息学研究所 （EMBL-EBI） 和美国国立卫生研究院的一个组成部分,国家医学图书馆-国家生物技术信息中心 （NLM-NCBI）。&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
PubMed诞生于1996年。最常用的文摘型数据库。其收录范围不仅包括Medline，还有大部分PMC和NIH基金资助作者的文献，NCBI书籍等。PubMed还提供链接到文献全文所在网站的全文链接。早期 PubMed 数据库主要的任务，是将 Mesh 目录(MEDlINE的早期目录，主题词表)中收录的医学主题与大量有关医学研究的文献相匹配。这意味着，PubMed最早的发布时间应该是在 1971 年，也就是 MEDLINE 数据库第一次正式发布的时间。&lt;br /&gt;
&lt;br /&gt;
MEDLINE始建于1966年（追溯收录至1946年），是NLM的期刊文献记录数据库。1983年，MEDLINE推出电子版，网上数据每日更新，光盘版每月更新。MEDLINE有严格的文献选择委员会LSTRC进行选刊。目前MEDLINE的文献都收录在PubMed中。&lt;br /&gt;
&lt;br /&gt;
PMC全称为PubMed Central，建立于2000年，由NCBI进行管理，是可以免费获取全文的生物医学和生命科学全文数据库，保存了NLM收录印刷杂志的电子副本。PMC的部分bookreview内容没有收录于PubMed。&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签库&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== EMBL（European Molecular Biology Laboratory）欧洲分子生物学实验室 ==&lt;br /&gt;
总部位于德国海德堡，1974年由欧洲14个国家加上亚洲的以色列共同发起建立，现在由欧洲29个成员国政府支持组成，目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。&lt;br /&gt;
&lt;br /&gt;
[https://www.embl.org www.embl.org]&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成.2002 年，PIR 与其国际合作伙伴 EBI（欧洲生物信息学研究所）和 SIB（瑞士生物信息学研究所）一起获得了 NIH 的资助，创建了 UniProt。 通过统一 PIR-PSD、Swiss-Prot 和 TrEMBL 数据库，实现蛋白质序列和功能的单一全球数据库。&lt;br /&gt;
* Uniprot是包含蛋白质序列，功能信息，论文索引的蛋白质数据库，整合了包括EBI,SIB,PIR三大数据库的资源。&lt;br /&gt;
**EMBL-EBI是指欧洲生物信息学研究所（European Bioinformatics Institute），EMBL的一部分。1982年建立了先进的核苷酸序列数据库（EMBL-DNA），可进行核苷酸序列检索及序列相似性查询。TrEMBL&lt;br /&gt;
**SIB,瑞士生物信息学研究所，维护着ExPASy的服务器,Swissprot&lt;br /&gt;
*** &#039;&#039;&#039;ExPASy&#039;&#039;&#039;是一个集成了多种生物信息学工具和数据库的平台，专门用于蛋白质和蛋白质组学的研究。除了蛋白质相关的数据外，ExPASy还提供了其他生物信息学资源，如代谢通路数据库（KEGG）等。其中，Protparam工具是经常使用的功能，它可以根据蛋白质序列估计蛋白质的等电点（pi）、疏水性等特性。&lt;br /&gt;
** PIR，由美国国家生物医学研究基金会（NBRF）于1984年成立,用于支持基因组学、蛋白质组学和系统生物学研究和科学研究。提供蛋白质数据库和分析工具，包括蛋白质序列数据库 （PSD）。PIR-PSD&lt;br /&gt;
*数据库的关系&lt;br /&gt;
通过INSDC等得到原始数据，处理后存入UniParc。&lt;br /&gt;
UniParc作为数据仓库，再分别给UniProtKB，Proteomes，UniRef提供可靠的数据集。&lt;br /&gt;
这里的UniProtKB 由两个子库构成 Swiss-Prot，TrEMBL。&lt;br /&gt;
Swiss-Prot 经过人工验证和注释，是高质量的蛋白质注释数据。但人工效率在高速增长的蛋白质数据面前显得极其低效。因此，注释这些数据需要大量时间，为了弥补这一问题。TrEMBL 被建立用于存储由机器自动翻译和预测的蛋白质序列。导致蛋白质数据冗余↑可信度↓。&lt;br /&gt;
[https://zhuanlan.zhihu.com/p/599641613 感谢知乎qwq]&lt;br /&gt;
简而言之，在UniProtKB数据库中Swiss-Prot是由TrEMBL经过手动注释后得到的高质量非冗余数据库，也是我们今后常用的蛋白质数据库之一。&lt;br /&gt;
** 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。UniParc由于数据冗余，将相同序列合并一条，唯一编号。&lt;br /&gt;
** 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
** 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=Playground&amp;diff=4816</id>
		<title>Playground</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=Playground&amp;diff=4816"/>
		<updated>2025-03-15T08:50:39Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;这是一个测试页面，用于测试wiki语法以及插件效果，可随意编辑此页。&lt;br /&gt;
&lt;br /&gt;
测试写入编辑&lt;br /&gt;
   echo &amp;quot;Hello, World!&amp;quot;&lt;br /&gt;
&lt;br /&gt;
== GeShi代码高亮 ==&lt;br /&gt;
&lt;br /&gt;
On the wiki page, you can now use &amp;quot;syntaxhighlight&amp;quot; elements:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;syntaxhighlight lang=&amp;quot;php&amp;quot;&amp;gt;&lt;br /&gt;
&amp;lt;?php&lt;br /&gt;
    v = &amp;quot;string&amp;quot;;    // sample initialization&lt;br /&gt;
?&amp;gt;&lt;br /&gt;
html text&lt;br /&gt;
&amp;lt;?php&lt;br /&gt;
    echo v;         // end of php code&lt;br /&gt;
?&amp;gt;&lt;br /&gt;
&amp;lt;/syntaxhighlight&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== 表格测试 ==&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! 标题文字 !! 标题文字 !! 标题文字 !! 标题文字 !! 标题文字 !! 标题文字&lt;br /&gt;
|-&lt;br /&gt;
| 示例 || 示例 || 示例 || 示例 || 示例 || 示例&lt;br /&gt;
|-&lt;br /&gt;
| 示例 || 示例 || 示例 || 示例 || 示例 || 示例&lt;br /&gt;
|-&lt;br /&gt;
| 示例 || 示例 || 示例 || 示例 || 示例 || 示例&lt;br /&gt;
|-&lt;br /&gt;
| 示例 || 示例 || 示例 || 示例 || 示例 || 示例&lt;br /&gt;
|-&lt;br /&gt;
| 示例 || 示例 || 示例 || 示例 || 示例 || 示例&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
页面文本。&amp;lt;ref&amp;gt;[https://www.embl.org// ]，万元神导致的。&amp;lt;/ref&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=Playground&amp;diff=4815</id>
		<title>Playground</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=Playground&amp;diff=4815"/>
		<updated>2025-03-15T08:48:59Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* 表格测试 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;这是一个测试页面，用于测试wiki语法以及插件效果，可随意编辑此页。&lt;br /&gt;
&lt;br /&gt;
测试写入编辑&lt;br /&gt;
   echo &amp;quot;Hello, World!&amp;quot;&lt;br /&gt;
&lt;br /&gt;
== GeShi代码高亮 ==&lt;br /&gt;
&lt;br /&gt;
On the wiki page, you can now use &amp;quot;syntaxhighlight&amp;quot; elements:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;syntaxhighlight lang=&amp;quot;php&amp;quot;&amp;gt;&lt;br /&gt;
&amp;lt;?php&lt;br /&gt;
    v = &amp;quot;string&amp;quot;;    // sample initialization&lt;br /&gt;
?&amp;gt;&lt;br /&gt;
html text&lt;br /&gt;
&amp;lt;?php&lt;br /&gt;
    echo v;         // end of php code&lt;br /&gt;
?&amp;gt;&lt;br /&gt;
&amp;lt;/syntaxhighlight&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== 表格测试 ==&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! 标题文字 !! 标题文字 !! 标题文字 !! 标题文字 !! 标题文字 !! 标题文字&lt;br /&gt;
|-&lt;br /&gt;
| 示例 || 示例 || 示例 || 示例 || 示例 || 示例&lt;br /&gt;
|-&lt;br /&gt;
| 示例 || 示例 || 示例 || 示例 || 示例 || 示例&lt;br /&gt;
|-&lt;br /&gt;
| 示例 || 示例 || 示例 || 示例 || 示例 || 示例&lt;br /&gt;
|-&lt;br /&gt;
| 示例 || 示例 || 示例 || 示例 || 示例 || 示例&lt;br /&gt;
|-&lt;br /&gt;
| 示例 || 示例 || 示例 || 示例 || 示例 || 示例&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
页面文本。&amp;lt;ref&amp;gt;[https://www.embi.org/ ]，万元神导致的。&amp;lt;/ref&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4814</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4814"/>
		<updated>2025-03-15T08:40:52Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* UniProt：联合蛋白质序列数据库 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
国际核苷酸序列数据库协作 （INSDC），包含NLM-NCBI(美国）,ENA(欧洲,EMBL与EBI参与),DDBJ(日本),&lt;br /&gt;
&lt;br /&gt;
其创始成员是信息和系统研究组织、日本国家遗传学研究所 （ROIS-NIG）、欧洲分子生物学实验室 - 欧洲生物信息学研究所 （EMBL-EBI） 和美国国立卫生研究院的一个组成部分,国家医学图书馆-国家生物技术信息中心 （NLM-NCBI）。&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
PubMed诞生于1996年。最常用的文摘型数据库。其收录范围不仅包括Medline，还有大部分PMC和NIH基金资助作者的文献，NCBI书籍等。PubMed还提供链接到文献全文所在网站的全文链接。早期 PubMed 数据库主要的任务，是将 Mesh 目录(MEDlINE的早期目录，主题词表)中收录的医学主题与大量有关医学研究的文献相匹配。这意味着，PubMed最早的发布时间应该是在 1971 年，也就是 MEDLINE 数据库第一次正式发布的时间。&lt;br /&gt;
&lt;br /&gt;
MEDLINE始建于1966年（追溯收录至1946年），是NLM的期刊文献记录数据库。1983年，MEDLINE推出电子版，网上数据每日更新，光盘版每月更新。MEDLINE有严格的文献选择委员会LSTRC进行选刊。目前MEDLINE的文献都收录在PubMed中。&lt;br /&gt;
&lt;br /&gt;
PMC全称为PubMed Central，建立于2000年，由NCBI进行管理，是可以免费获取全文的生物医学和生命科学全文数据库，保存了NLM收录印刷杂志的电子副本。PMC的部分bookreview内容没有收录于PubMed。&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签库&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== EMBL（European Molecular Biology Laboratory）欧洲分子生物学实验室 ==&lt;br /&gt;
总部位于德国海德堡，1974年由欧洲14个国家加上亚洲的以色列共同发起建立，现在由欧洲29个成员国政府支持组成，目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。&lt;br /&gt;
&lt;br /&gt;
[https://www.embl.org www.embl.org]&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成.2002 年，PIR 与其国际合作伙伴 EBI（欧洲生物信息学研究所）和 SIB（瑞士生物信息学研究所）一起获得了 NIH 的资助，创建了 UniProt。 通过统一 PIR-PSD、Swiss-Prot 和 TrEMBL 数据库，实现蛋白质序列和功能的单一全球数据库。&lt;br /&gt;
* Uniprot是包含蛋白质序列，功能信息，论文索引的蛋白质数据库，整合了包括EBI,SIB,PIR三大数据库的资源。&lt;br /&gt;
**EMBL-EBI是指欧洲生物信息学研究所（European Bioinformatics Institute），EMBL的一部分。1982年建立了先进的核苷酸序列数据库（EMBL-DNA），可进行核苷酸序列检索及序列相似性查询。TrEMBL&lt;br /&gt;
**SIB,瑞士生物信息学研究所，维护着ExPASy的服务器,Swissprot&lt;br /&gt;
*** &#039;&#039;&#039;ExPASy&#039;&#039;&#039;是一个集成了多种生物信息学工具和数据库的平台，专门用于蛋白质和蛋白质组学的研究。除了蛋白质相关的数据外，ExPASy还提供了其他生物信息学资源，如代谢通路数据库（KEGG）等。其中，Protparam工具是经常使用的功能，它可以根据蛋白质序列估计蛋白质的等电点（pi）、疏水性等特性。&lt;br /&gt;
** PIR，由美国国家生物医学研究基金会（NBRF）于1984年成立,用于支持基因组学、蛋白质组学和系统生物学研究和科学研究。提供蛋白质数据库和分析工具，包括蛋白质序列数据库 （PSD）。PIR-PSD&lt;br /&gt;
&lt;br /&gt;
* 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。&lt;br /&gt;
* 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
* 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4812</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4812"/>
		<updated>2025-03-15T07:59:36Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​文献库部分补充&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
国际核苷酸序列数据库协作 （INSDC），包含NLM-NCBI(美国）,ENA(欧洲,EMBL与EBI参与),DDBJ(日本)&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
PubMed诞生于1996年。最常用的文摘型数据库。其收录范围不仅包括Medline，还有大部分PMC和NIH基金资助作者的文献，NCBI书籍等。PubMed还提供链接到文献全文所在网站的全文链接。早期 PubMed 数据库主要的任务，是将 Mesh 目录(MEDlINE的早期目录，主题词表)中收录的医学主题与大量有关医学研究的文献相匹配。这意味着，PubMed最早的发布时间应该是在 1971 年，也就是 MEDLINE 数据库第一次正式发布的时间。&lt;br /&gt;
&lt;br /&gt;
MEDLINE始建于1966年（追溯收录至1946年），是NLM的期刊文献记录数据库。1983年，MEDLINE推出电子版，网上数据每日更新，光盘版每月更新。MEDLINE有严格的文献选择委员会LSTRC进行选刊。目前MEDLINE的文献都收录在PubMed中。&lt;br /&gt;
&lt;br /&gt;
PMC全称为PubMed Central，建立于2000年，由NCBI进行管理，是可以免费获取全文的生物医学和生命科学全文数据库，保存了NLM收录印刷杂志的电子副本。PMC的部分bookreview内容没有收录于PubMed。&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签库&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成&lt;br /&gt;
* Uniprot是包含蛋白质序列，功能信息，论文索引的蛋白质数据库，整合了包括EBI,SIB,PIR三大数据库的资源。&lt;br /&gt;
**&lt;br /&gt;
&lt;br /&gt;
* 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。&lt;br /&gt;
* 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
* 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4810</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4810"/>
		<updated>2025-03-15T07:11:59Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* UniProt：联合蛋白质序列数据库 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
国际核苷酸序列数据库协作 （INSDC），包含NLM-NCBI(美国）,ENA(欧洲,EMBL与EBI参与),DDBJ(日本)&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签库&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成&lt;br /&gt;
* Uniprot是包含蛋白质序列，功能信息，论文索引的蛋白质数据库，整合了包括EBI,SIB,PIR三大数据库的资源。&lt;br /&gt;
**&lt;br /&gt;
&lt;br /&gt;
* 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。&lt;br /&gt;
* 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
* 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4807</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4807"/>
		<updated>2025-03-15T04:02:21Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心） */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签库&lt;br /&gt;
BLAST是由ncbi开发的序列比对工具，基于局部序列比对，寻找序列之间的相似者&lt;br /&gt;
&lt;br /&gt;
* 返回值&lt;br /&gt;
** E值Expect，∈[0,1]，表示随机配对的可能性，E值越大，随机可能性越大&lt;br /&gt;
** 相似性/一致性Identities,匹配上的碱基数占总序列长的百分数。&lt;br /&gt;
** score得分，来自打分矩阵，分数高同源性强&lt;br /&gt;
** Gaps两序列之间缺少或多出的对不上部分，缺失或插入，用——表示&lt;br /&gt;
** Strand&lt;br /&gt;
*** plus/plus +/+表示两条序列是相同方向的&lt;br /&gt;
*** plus/minus +/-表示两条序列一正一反，5-3与3-5&lt;br /&gt;
&lt;br /&gt;
* 类型&lt;br /&gt;
** BLASTn，对比核酸及其互补序列与核酸库&lt;br /&gt;
** BLASTp，对比蛋白质与蛋白库&lt;br /&gt;
** BLASTx，将核酸翻译为蛋白质后比对&lt;br /&gt;
** tBLASTn，将蛋白质翻译为核酸后比对核酸&lt;br /&gt;
** tBLASTx，将核酸翻译成蛋白质后与数据库中翻译成蛋白质的核酸进行比对&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成&lt;br /&gt;
* 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。&lt;br /&gt;
* 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
* 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4804</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4804"/>
		<updated>2025-03-15T00:50:14Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心） */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
* Refseq，来自NCBI的参考序列计划，提供非冗余的标准序列，包括基因组，蛋白质和染色体&lt;br /&gt;
* dBEST，表达序列标签库&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成&lt;br /&gt;
* 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。&lt;br /&gt;
* 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
* 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4803</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4803"/>
		<updated>2025-03-14T23:40:33Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​关于NCBI的一些东西，还没写完&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
&lt;br /&gt;
* GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
** LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
** ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
** VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI&lt;br /&gt;
** FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
** SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
** KEYWORDS用于检索的关键词&lt;br /&gt;
** REFERENCE参考文献&lt;br /&gt;
** ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
* FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
* FASTQ测序仪原始数据，共四行&lt;br /&gt;
** 第一行： 用“@”开头，写read的名称&lt;br /&gt;
** 第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
** 第三行：用“+”开头，描述&lt;br /&gt;
** 第四行： 用ASCII码表示的read质量分数 数据库&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成&lt;br /&gt;
* 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。&lt;br /&gt;
* 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
* 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4802</id>
		<title>生物信息数据库及工具简介整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%94%9F%E7%89%A9%E4%BF%A1%E6%81%AF%E6%95%B0%E6%8D%AE%E5%BA%93%E5%8F%8A%E5%B7%A5%E5%85%B7%E7%AE%80%E4%BB%8B%E6%95%B4%E7%90%86&amp;diff=4802"/>
		<updated>2025-03-14T23:37:07Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心） */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;现介绍生物信息数据库及工具。&lt;br /&gt;
&lt;br /&gt;
=NCBI（National Center for Biotechnology Information，美国国家生物技术信息中心）=&lt;br /&gt;
已故的参议员克劳德·佩珀（Claude Pepper）认识到计算机信息处理方法对于进行生物医学研究的重要性，并发起了立法。他于1988年11月4日在美国国立卫生研究院（NIH）成立了美国国家生物技术信息中心（NCBI）并作为美国国家医学图书馆（NLM）的一个部门。选择了在NLM是因为它有创建和维护生物医学数据库方面的经验，又因为它是NIH的一部分，因此可以建立计算分子生物学的研究计划。 NIH的集体研究组成了世界上最大的生物医学研究机构。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The late Senator Claude Pepper recognized the importance of computerized information processing methods for the conduct of biomedical research and sponsored legislation that established the National Center for Biotechnology Information (NCBI) on November 4, 1988, as a division of the National Library of Medicine (NLM) at the National Institutes of Health (NIH). NLM was chosen for its experience in creating and maintaining biomedical databases, and because as part of NIH, it could establish an intramural research program in computational molecular biology. The collective research components of NIH make up the largest biomedical research facility in the world.）&#039;&#039;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/home/about/ About NCBI]&amp;lt;/ref&amp;gt;&lt;br /&gt;
Entrez是NCBI开发的检索系统，可以查Genbank，PubMed(文献数据库）等数据库的信息。&lt;br /&gt;
&lt;br /&gt;
Genbank是由NCBI建立的DNA数据库，包含EST（表达序列标签）和STS（序列标记位点）等。&lt;br /&gt;
GBFF是Genbank的原始文件格式，包含很多注释，&lt;br /&gt;
LOCUS表示基因座名字，核酸序列长度，分子类别，拓扑类型，更新日期&lt;br /&gt;
ACCESSION检索号，数据在数据库当中唯一不变的检索编号，用GCA_起始&lt;br /&gt;
VERSIONS版本号格式为“检索号.数字”，初始为1，更改时版本号增加（从2015开始NCBI淘汰了写在版本号旁边的改一次变一次的GI号)&lt;br /&gt;
FEATs(FEATUREs)重要注释内容&amp;lt;其中包含dna来源质粒/基因组？的source，RBS，CDS，promoter启动子）&lt;br /&gt;
SOURCE表示来源生物物种的俗名，如小鼠和人&lt;br /&gt;
KEYWORDS用于检索的关键词&lt;br /&gt;
REFERENCE参考文献&lt;br /&gt;
ORIGRINS核酸序列 ATCTTGCATAC，用“//”双斜线结束&lt;br /&gt;
FASTA使用于序列比对的，格式第一部分是序列名字，与&amp;gt;相连，第二部分用空格与序列名字相隔，表示注释信息，可以没有。第三部分bp一行60字母&lt;br /&gt;
FASTQ测序仪原始数据，共四行&lt;br /&gt;
第一行： 用“@”开头，写read的名称&lt;br /&gt;
第二行： 测序序列，ATCGN（识别不出来的时候写N&lt;br /&gt;
第三行：用“+”开头，描述&lt;br /&gt;
第四行： 用ASCII码表示的read质量分数&lt;br /&gt;
数据库&lt;br /&gt;
&lt;br /&gt;
==数据库==&lt;br /&gt;
&lt;br /&gt;
===Assembly数据库===&lt;br /&gt;
标签：综合基因组数据库&lt;br /&gt;
&lt;br /&gt;
一个提供有关组装的基因组结构，组装名称和其他元数据，统计报告以及与基因组序列数据的链接的信息的数据库。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A database providing information on the structure of assembled genomes, assembly names and other meta-data, statistical reports, and links to genomic sequence data.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
Assembly数据库包含有关组装基因组结构的信息，如AGP文件中所示或完整测序的染色体的集合。 该数据库提供了版本化的程序集登录号，该编号可跟踪程序集的更改，这些更改是通过随着时间的推移提交组来更新的。 该Web资源提供有关程序集的元数据，例如程序集名称（和备用名称），简单的程序集统计报告（重叠群，脚手架的类型和数量； N50）以及更新的历史视图。 它还跟踪提交给国际核苷酸序列数据库协作（INSDC）的程序集（即DDBJ，ENA或GenBank）与NCBI参考序列（RefSeq）项目中表示的程序集之间的关系。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：The Assembly database has information about the structure of assembled genomes as represented in an AGP file or as a collection of completely sequenced chromosomes. The database provides a versioned Assembly accession number that tracks changes to assemblies as they are updated by submitting groups over time. The web resource provides meta-data about assemblies such as assembly names (and alternate names), simple statistical reports of the assembly (type and number of contigs, scaffolds; N50s) and a history view of updates. It also tracks the relationship between an assembly submitted to the International Nucleotide Sequence Database Collaboration ( INSDC ), i.e. DDBJ , ENA or GenBank , and the assembly represented in the NCBI Reference Sequence (RefSeq) project.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:Assembly.png|无|缩略图|360x360px|替代=]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/assembly&amp;lt;ref name=&amp;quot;:0&amp;quot;&amp;gt;[https://www.ncbi.nlm.nih.gov/guide/all/ All Resources]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/assembly/help/ assembly help]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioCollections数据库===&lt;br /&gt;
标签：标本数据库&lt;br /&gt;
&lt;br /&gt;
是用于文化收藏，博物馆，草本植物和其他自然历史收藏（包括达尔文核心机构和收藏代码）的链接元数据的精选数据集，以及用于将标本ID映射到收藏站点上的网页的链接。Biocollections存储“结构化凭证”（机构代码：可选集合代码：样本ID，如：/culture_collection=&amp;quot;ISBC:CMF:1866&amp;quot;）中使用的首字母缩略词，用于向国际核苷酸序列数据库（INSDC）（GenBank，欧洲核苷酸档案库（ENA）和日本DNA数据库（DDBJ））和NCBI的BioSample提交的序列条目。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：BioCollections is a curated dataset of metadata for culture collections, museums, herbaria and other natural history collections, including Darwin Core institution and collection codes, and URL formulae for mapping specimen ids to web pages at the collection site. Biocollections stores acronyms used in “structured vouchers” for sequence entries submitted to the International Nucleotide Sequence Database (INSDC)(GenBank, European Nucleotide Archive (ENA), and DNA Databank of Japan (DDBJ)) and NCBI’s BioSample.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;注意：本数据库不收录来自个人的生物标本藏品，仅指向各馆藏数据库。&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
查询：&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;2&amp;quot; |代码&lt;br /&gt;
!意思&lt;br /&gt;
!注文&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[icode]&lt;br /&gt;
|检索机构代码（部分代码）&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[uicode]&lt;br /&gt;
|检索唯一的机构代码&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[ccode]&lt;br /&gt;
|检索对应的收藏代码（/specimen_voucher=&amp;quot;UAM:&#039;&#039;&#039;Mamm&#039;&#039;&#039;:24119&amp;quot;）&lt;br /&gt;
|哺乳类：Mamm&lt;br /&gt;
鱼类：Fish&lt;br /&gt;
&lt;br /&gt;
昆虫：Ento&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[iname]&lt;br /&gt;
|搜索机构名称&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[cname]&lt;br /&gt;
|搜索收藏类型&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| colspan=&amp;quot;2&amp;quot; |[all]&lt;br /&gt;
|以上所有&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
| rowspan=&amp;quot;3&amp;quot; |按类别搜索&lt;br /&gt;
|collection type museum[prop]&lt;br /&gt;
|检索博物馆&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type herbarium[prop]&lt;br /&gt;
|检索植物标本室&lt;br /&gt;
|&lt;br /&gt;
|-&lt;br /&gt;
|collection type culture collection[prop]&lt;br /&gt;
|检索文化类型收集&lt;br /&gt;
|&lt;br /&gt;
|}&lt;br /&gt;
[[文件:BioCollections2.png|无|缩略图|226x226像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioCollections.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/biocollections&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&amp;lt;ref&amp;gt;[https://www.ncbi.nlm.nih.gov/biocollections/docs/query/ Biocollections Query Tips]&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;[[/www.cnblogs.com/yahengwang/p/9550410.html|生物数据库介绍——NCBI]]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioProject数据库（旧称：Genome Project）===&lt;br /&gt;
标签：项目计划数据库&lt;br /&gt;
&lt;br /&gt;
生物项目是与来自单个组织或财团的单个计划相关的生物数据的集合。 BioProject记录为用户提供了一个单一的位置，可以找到该项目生成的各种数据的链接，并存储到INSDC成员维护的档案数据库中。 BioProject的典型示例包括用于对多种细菌菌株进行测序的多分离项目，或特定生物的基因组和转录组的单分离项目。您提供的有关这项研究工作的描述对于为实验数据提供上下文非常重要。一个基因组学，功能基因组学和遗传学研究的集合，并链接到它们产生的数据集。该资源描述了项目的范围，材料和目标，并提供了一种检索数据集的机制，这些数据集由于注释不一致，多次独立提交以及通常存储在不同数据库中的多种数据类型的不同性质而常常很难找到。（机翻）&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;（原文：A BioProject is a collection of biological data related to a single initiative originating from a single organization or from a consortium. A BioProject record provides users a single place to find links to the diverse data generated for that project and deposited into the archival databases maintained by members of the INSDC. Typical examples of a BioProject include a multiisolate project for sequencing multiple strains of a bacterial species, or a monoisolate project for the genome and transcriptome of a particular organism. The description you supply about this research effort is important for providing context to your experimental data. A collection of genomics, functional genomics, and genetics studies and links to their resulting datasets. This resource describes project scope, material, and objectives and provides a mechanism to retrieve datasets that are often difficult to find due to inconsistent annotation, multiple independent submissions, and the varied nature of diverse data types which are often stored in different databases.）&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
大型计划：&lt;br /&gt;
&lt;br /&gt;
The 1000 Genomes Project (human)千人基因组计划[https://www.ncbi.nlm.nih.gov/bioproject/28889 （ID：28889）]&lt;br /&gt;
[[文件:BioProject3.png|无|缩略图]]&lt;br /&gt;
[[文件:BioProject4.png|无|缩略图]]&lt;br /&gt;
The human ENCODE (ENCyclopedia Of DNA Elements) project人类DNA元素百科全书计划[https://www.ncbi.nlm.nih.gov/bioproject/30707 （ID：30707）]&lt;br /&gt;
&lt;br /&gt;
NIH Human Microbiome Project (HMP) Roadmap Project人类微生物组计划[https://www.ncbi.nlm.nih.gov/bioproject/43021 （ID：43021）]&lt;br /&gt;
&lt;br /&gt;
浏览计划样式：&lt;br /&gt;
[[文件:BioProject2.png|无|缩略图]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
网页视图：&lt;br /&gt;
[[文件:BioProject.png|无|缩略图|360x360像素]]&lt;br /&gt;
&lt;br /&gt;
网页地址：https://www.ncbi.nlm.nih.gov/bioproject&amp;lt;ref name=&amp;quot;:0&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
===BioSample数据库===&lt;br /&gt;
标签：实验材料数据库&lt;br /&gt;
&lt;br /&gt;
===BioSystems数据库===&lt;br /&gt;
&lt;br /&gt;
= UCSC基因组浏览器 =&lt;br /&gt;
&#039;&#039;&#039;UCSC 基因组浏览器&#039;&#039;&#039;是由加州大学圣克鲁斯分校(UCSC)的在线可下载基因组浏览器。提供来自各种脊椎动物和无脊椎动物物种以及主要模式生物的基因组序列数据,是一个图形查看器.&lt;br /&gt;
[[文件:UCSC.png|左|缩略图|UCSC基因组浏览器的页面]]&lt;br /&gt;
可以看到，UCSC浏览器上可以看到各个数据库对同一基因组片段的注释，而这里恰好是音猬因子SHH所在处。自上而下有：&lt;br /&gt;
&lt;br /&gt;
* 蓝色的GENCODE&lt;br /&gt;
* 深蓝色的RefSeq&lt;br /&gt;
* 绿色的OMIM（在线人类孟德尔遗传），收集了有关人类遗传病的突变。&lt;br /&gt;
* 黄色的ENCODE&lt;br /&gt;
* 等等等等&lt;br /&gt;
&lt;br /&gt;
[[文件:UCSC 3.png|左|缩略图|UCSC的RefSeq]]&lt;br /&gt;
关于RefSeq的条带，四条条带代表四个剪接变体，细线是被剪掉的内含子，较细的粗线是UTR，较粗的粗线是蛋白质编码序列。细线上的小箭头是转录方向的意思。&lt;br /&gt;
&lt;br /&gt;
=== BLAT ===&lt;br /&gt;
BLAT（BLAST-like比对工具）也出自UCSC，最初目的是快速的将小鼠基因组和人类基因组对齐，速度提升了数百倍。&lt;br /&gt;
&lt;br /&gt;
== UniProt：联合蛋白质序列数据库 ==&lt;br /&gt;
&lt;br /&gt;
* 起源：TrEMBL、Swiss-Prot、PIR-PSD三个数据库的数据合并而成&lt;br /&gt;
* 第一层次：UniPrac(Uniprot archive，档案馆)：三个子库中所有序列的直接合并，信息比较粗糙，冗余。&lt;br /&gt;
* 第二层次：UniRef（UniProt Reference Clusters）：去除了重复序列，UniRef100即去除了完全相同的冗余序列后的剩余，UniRef90即去除了相似性在90%以上的相似序列后的剩余，依此类推。&lt;br /&gt;
* 第三层次：UniProtKB(UniProt KnowledgeBase)：详细注释的，有文献和其他数据库链接的精品数据库，有UniProtKB/TrEMBL（自动注释）和UniProtKB/Swissprot（人工注释）两部分。&lt;br /&gt;
* 还有Proteomes库是蛋白质组数据库&lt;br /&gt;
&amp;lt;references /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E8%AE%A8%E8%AE%BA:%E6%A4%8D%E7%89%A9%E7%9F%BF%E8%B4%A8%E5%85%83%E7%B4%A0%E6%95%B4%E7%90%86&amp;diff=4708</id>
		<title>讨论:植物矿质元素整理</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E8%AE%A8%E8%AE%BA:%E6%A4%8D%E7%89%A9%E7%9F%BF%E8%B4%A8%E5%85%83%E7%B4%A0%E6%95%B4%E7%90%86&amp;diff=4708"/>
		<updated>2025-03-13T07:50:11Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;能不能再加一列转移运输方式啊？（就是哪些矿质元素容易移动哪些不容易移动，哪些新叶容易缺乏哪些老叶容易缺乏之类的）&lt;br /&gt;
&lt;br /&gt;
Ca Mn Fe Cu S B 不移动而新叶先缺乏w&lt;br /&gt;
其他的应该都是老叶先缺乏罢，我比较菜不知道qwq&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E9%A2%9C%E8%89%B2%E5%8F%8D%E5%BA%94&amp;diff=4459</id>
		<title>颜色反应</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E9%A2%9C%E8%89%B2%E5%8F%8D%E5%BA%94&amp;diff=4459"/>
		<updated>2025-03-10T08:32:58Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* Tollens&amp;#039;试剂 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;本页面主要总结生化中常见的颜色反应。&lt;br /&gt;
&lt;br /&gt;
== 糖类相关颜色反应 ==&lt;br /&gt;
&lt;br /&gt;
=== Bial 试验 ===&lt;br /&gt;
[[文件:Bial实验.png|缩略图|bial实验]]&lt;br /&gt;
[[文件:Bial实验2.png|缩略图|bial实验]]&lt;br /&gt;
苔黑酚（甲基间苯二酚/地衣酚）、浓盐酸、氯化铁。用于鉴定戊糖。&lt;br /&gt;
&lt;br /&gt;
戊糖会脱水形成糠醛，再产生蓝色或绿色的产物。&lt;br /&gt;
&lt;br /&gt;
己糖可能会产生浑浊棕色、黄色或灰色的溶液，很容易与戊糖的绿色区分开来。&lt;br /&gt;
&lt;br /&gt;
bial实验似乎不能区分DNA和RNA。&lt;br /&gt;
[[文件:二苯胺.png|缩略图|二苯胺]]&lt;br /&gt;
&lt;br /&gt;
=== Dische 测试 ===&lt;br /&gt;
二苯胺、冰醋酸、硫酸和乙醇。&lt;br /&gt;
&lt;br /&gt;
加热时，DNA会产生蓝色，但RNA不产生反应。&lt;br /&gt;
&lt;br /&gt;
=== Seliwanoff 检验 ===&lt;br /&gt;
间苯二酚和浓盐酸。&lt;br /&gt;
[[文件:Seliwanoff实验.png|缩略图|seliwanoff实验]]&lt;br /&gt;
醛糖会产生淡红色，而酮糖迅速产生鲜红色。&lt;br /&gt;
&lt;br /&gt;
蔗糖也会产生鲜红色。&lt;br /&gt;
&lt;br /&gt;
=== Molisch检验 ===&lt;br /&gt;
糖与α-萘酚乙醇溶液混合，向其上方加入一层浓硫酸，交界处产生红色环。&lt;br /&gt;
&lt;br /&gt;
用于鉴定是否无糖（不只有糖会反应）的存在。&lt;br /&gt;
&lt;br /&gt;
=== &#039;&#039;&#039;蒽酮检验&#039;&#039;&#039; ===&lt;br /&gt;
与Molisch检验原理类似，使用蒽酮和浓硫酸，在620nm有最大光吸收，可用于总糖定量。&lt;br /&gt;
&lt;br /&gt;
=== Fehling试剂&amp;amp;Benedict试剂 ===&lt;br /&gt;
斐林试剂：酒石酸钾钠、氢氧化钠、硫酸铜。&lt;br /&gt;
&lt;br /&gt;
本尼迪特试剂：碳酸钠、柠檬酸钠、硫酸铜。&lt;br /&gt;
&lt;br /&gt;
水浴加热，还原糖可以产生砖红色沉淀。&lt;br /&gt;
&lt;br /&gt;
* Barfoed实验：乙酸铜和乙酸，煮沸&lt;br /&gt;
&lt;br /&gt;
=== Tollens&#039;试剂 ===&lt;br /&gt;
即银氨溶液。银氨配合物被醛还原为银单质。&lt;br /&gt;
&lt;br /&gt;
* Tollens’试剂有时指间苯三酚鉴定戊糖，这个检测方法与银氨溶液是同一个人发现的。&lt;br /&gt;
&lt;br /&gt;
== 氨基酸相关颜色反应 ==&lt;br /&gt;
&lt;br /&gt;
=== 米伦反应 ===&lt;br /&gt;
米伦反应（Millon reaction）被用作检测蛋白质，但实质是酪氨酸参与反应。&lt;br /&gt;
&lt;br /&gt;
试剂中含有亚硝酸与硝酸，以及Hg(Ⅱ)和Hg(Ⅲ)离子，主要的显色反应是汞离子的配合过程。&lt;br /&gt;
&lt;br /&gt;
[[文件:米伦反应.png|无框|384x384像素]]&lt;br /&gt;
&lt;br /&gt;
可以看到被硝化后提供了配位反应的基团，因此产生颜色。&lt;br /&gt;
&lt;br /&gt;
产生白色沉淀，加热后变成红色&lt;br /&gt;
&lt;br /&gt;
=== &amp;lt;big&amp;gt;坂口反应&amp;lt;/big&amp;gt; ===&lt;br /&gt;
坂口反应（Sakaguchi reaction），精氨酸的分析与测定，可用NaOH和NaCIO。&lt;br /&gt;
&lt;br /&gt;
胍基与α-萘酚在碱性NaBrO中发生反应，生成红色产物。&lt;br /&gt;
&lt;br /&gt;
=== Hopkins-Cole反应 ===&lt;br /&gt;
这个又叫乙醛酸反应（Glyoxylate reaction），反应过程涉及次溴酸根。&lt;br /&gt;
&lt;br /&gt;
在蛋白溶液中加入乙醛酸，并沿试管壁慢慢注入浓硫酸，在两液层之间就会出现紫色环，凡含有吲哚基的化合物（氨基酸中的Trp）都有此反应&lt;br /&gt;
&lt;br /&gt;
=== &amp;lt;big&amp;gt;茚三酮反应&amp;lt;/big&amp;gt; ===&lt;br /&gt;
茚三酮反应（ninhydrin reaction），首先氨基酸被茚三酮氧化分解为醛、氨、CO&amp;lt;sub&amp;gt;2&amp;lt;/sub&amp;gt;,弱酸下还原性茚三酮与氨和另一分子茚三酮缩合成蓝紫色物质，在570nm有吸收峰。&lt;br /&gt;
&lt;br /&gt;
其中脯氨酸与羟脯氨酸与茚三酮反应生成黄色物质。&lt;br /&gt;
&lt;br /&gt;
=== 黄色反应 ===&lt;br /&gt;
芳香族氨基酸（Tyr最为灵敏）溶液中遇到浓硝酸后，先产生白色沉淀，加热则变黄，再加碱颜色还会加深，变为橙黄色。&lt;br /&gt;
&lt;br /&gt;
由于苯环被硝化，产生了硝基苯衍生物&lt;br /&gt;
&lt;br /&gt;
这个反应很灵敏&lt;br /&gt;
&lt;br /&gt;
有个[[:文件:黄色反应.png|图]]，可以去文件里看&lt;br /&gt;
&lt;br /&gt;
== 蛋白质相关颜色反应 ==&lt;br /&gt;
&lt;br /&gt;
==== &#039;&#039;&#039;&amp;lt;big&amp;gt;考马斯亮蓝法（Bradford反应）&amp;lt;/big&amp;gt;&#039;&#039;&#039; ====&lt;br /&gt;
考马斯亮蓝:游离态呈红色(吸收峰为488nm)，利用芳香环与与蛋白质疏水区结合后呈亮蓝色(吸收峰为595nm)。&lt;br /&gt;
[[文件:考马斯亮蓝.png|缩略图]]&lt;br /&gt;
优点:反应灵敏，试剂简单，速率快，且不易被干扰。&lt;br /&gt;
&lt;br /&gt;
缺点:线性关系不是很好。&lt;br /&gt;
&lt;br /&gt;
有两种型号的考马斯亮蓝:R250和G250。&lt;br /&gt;
&lt;br /&gt;
R250:可以被洗脱，可用于电泳条带染色。&lt;br /&gt;
&lt;br /&gt;
G250:较R250多俩甲基，所以疏水性更强一些，结合迅速，常用于定量。&lt;br /&gt;
&lt;br /&gt;
=== 双缩脲法 ===&lt;br /&gt;
当底物中含有肽键时（多肽），试液中的铜与多肽配位，配合物呈紫色，吸收峰为540nm&lt;br /&gt;
&lt;br /&gt;
常用于需要快速但并不需要十分精确的测定。硫酸铵不干扰此呈色反应，使其有利于对蛋白质纯化早期步骤的测定&lt;br /&gt;
&lt;br /&gt;
=== 福林酚法（Lowry法） ===&lt;br /&gt;
蛋白质与铜离子生成复合物后，其分子中的酪氨酸和色氨酸还原Folin-酚试剂中的磷钼酸及磷钨酸，生成蓝色化合物（钨蓝和钼蓝的混合物）。&lt;br /&gt;
&lt;br /&gt;
此反应灵敏度很高，常用来测定蛋白含量，吸收峰为750nm&lt;br /&gt;
&lt;br /&gt;
最早由Folin发明，后来被Lowry改进&lt;br /&gt;
&lt;br /&gt;
优点：应用广泛&lt;br /&gt;
&lt;br /&gt;
缺点：专一性较差，干扰物质多（如Tris缓冲剂，蔗糖，硫酸铵，巯基化物，酚类，柠檬酸等），标准曲线的直线关系不特别严格。&lt;br /&gt;
&lt;br /&gt;
=== BCA法 ===&lt;br /&gt;
基于双缩脲原理，碱性条件下蛋白质将Cu2+还原成Cu+，BCA鳌合Cu+作为显色剂，产生蓝紫色物质，吸收峰在562nm&lt;br /&gt;
&lt;br /&gt;
优点：抗干扰能力强，不易受一般浓度去污剂的干扰&lt;br /&gt;
&lt;br /&gt;
缺点：可受螯合剂，高浓度还原剂的影响。&lt;br /&gt;
&lt;br /&gt;
== 核酸相关颜色反应 ==&lt;br /&gt;
&lt;br /&gt;
=== 福尔根反应 ===&lt;br /&gt;
Schiff试剂：希夫试剂（又称品红亚硫酸试剂），与醛作用而不与酮作用。&lt;br /&gt;
&lt;br /&gt;
样本水解完RNA后，用1mol/L HCl，使DNA碱基与脱氧核糖之间的糖苷键&amp;amp;磷酯键断裂，暴露醛基，与Schiff试剂反应形成紫红色化合物&lt;br /&gt;
&lt;br /&gt;
=== 甲基绿-派格宁染色法（Unna 染色法） ===&lt;br /&gt;
甲基绿：带两个单位正电荷，与dsDNA结合，使之呈绿色&lt;br /&gt;
&lt;br /&gt;
派格宁（又称嗞罗红）：带一个单位正电荷，与RNA结合，使之呈红色&lt;br /&gt;
&lt;br /&gt;
== 其他物质相关反应 ==&lt;br /&gt;
&lt;br /&gt;
=== 木质素染色 ===&lt;br /&gt;
试剂：间苯三酚、盐酸溶液&lt;br /&gt;
&lt;br /&gt;
流程：先将材料由盐酸浸透，再加间苯三酚溶液，间苯三酚与木质素反应发生樱红色。&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E6%8F%90%E5%87%BA%E4%BD%A0%E7%9A%84%E9%97%AE%E9%A2%98&amp;diff=4315</id>
		<title>提出你的问题</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E6%8F%90%E5%87%BA%E4%BD%A0%E7%9A%84%E9%97%AE%E9%A2%98&amp;diff=4315"/>
		<updated>2025-03-06T11:23:01Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​/* 生态学 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;br /&gt;
应该有不少生物竞赛的学生在访问这个网站。为此创建这样一个页面。&lt;br /&gt;
&lt;br /&gt;
提问者：注册一个账号即可编辑，请在“未解答”栏目写下你学竞赛的问题，请注明身份。&lt;br /&gt;
&lt;br /&gt;
回答者：大佬们可以访问这个页面来查看有没有新的问题。如果您可以解答，请在问题下方编辑（没有编辑按钮就去登录）好回答，并将该词条转移到“已解答”栏目。&lt;br /&gt;
&lt;br /&gt;
或者也可以在这里提出您需要的整理。&lt;br /&gt;
&lt;br /&gt;
建议大家回答问题的时候标注一下知识来源&lt;br /&gt;
&lt;br /&gt;
== 未解答 ==&lt;br /&gt;
&lt;br /&gt;
=== 遗传学 ===&lt;br /&gt;
累加作用，积加作用，叠加作用在遗传比例方面的区别是什么呢？&lt;br /&gt;
&lt;br /&gt;
=== 生物化学 ===&lt;br /&gt;
&lt;br /&gt;
甲酰CoA在人体中是怎么代谢的？&lt;br /&gt;
&lt;br /&gt;
异亮氨酸与α螺旋的破坏关联性强不强&lt;br /&gt;
&lt;br /&gt;
=== 生态学 ===&lt;br /&gt;
求英美学派，法瑞学派，前苏联学派和北欧学派的区别qwq&lt;br /&gt;
=== 生物信息 ===&lt;br /&gt;
人类进化分析为何不用x或常染色体？&lt;br /&gt;
&lt;br /&gt;
如何在uniprot中查询蛋白复合体的结构？如果不能，有什么组装蛋白复合体的软件？&lt;br /&gt;
&lt;br /&gt;
=== 分子生物学 ===&lt;br /&gt;
链霉溶菌素和利链霉素是一个东西吗？（根据找到的资料，它们都作用于RNA聚合酶的核心酶β亚基，抑制转录延伸）&lt;br /&gt;
&lt;br /&gt;
=== 植物及生理学 ===&lt;br /&gt;
飞廉的刺是茎刺还是叶刺？&lt;br /&gt;
&lt;br /&gt;
空球藻的细胞之间有没有胞间连丝？&lt;br /&gt;
&lt;br /&gt;
叶片的发育过程中，是叶基部先成熟，还是叶尖部先成熟呢？&lt;br /&gt;
&lt;br /&gt;
关于蕨类的幼叶拳卷现象，是大多数蕨类都有？还是只有真蕨亚门有呢？有哪些蕨类没有？&lt;br /&gt;
&lt;br /&gt;
乙醇酸氧化酶和黄素氧化剂酶的区别？详细些的求求了（末端氧化酶）&lt;br /&gt;
&lt;br /&gt;
抗坏血酸氧化的磷氧比为什么是1呢？&lt;br /&gt;
&lt;br /&gt;
想问一下有没有关于光合电子传递链抑制剂及其作用部位的整理，谢谢！&lt;br /&gt;
&lt;br /&gt;
为什么有些植物的花是闭花授粉，但授粉完成后还会开放呢？(如豌豆)&lt;br /&gt;
&lt;br /&gt;
看图要怎么区分假年轮和年轮？&lt;br /&gt;
=== 动物及生理学 ===&lt;br /&gt;
关于应激反应和应急反应，参加反应的激素有哪些区别呢？&lt;br /&gt;
&lt;br /&gt;
关于乌贼的石灰质内壳，应该是来源于外套膜的分泌，同时体内出现了中胚层形成的软骨，为什么说石灰质内壳是外、中胚层来源的呢？&lt;br /&gt;
&lt;br /&gt;
肋骨三问：&lt;br /&gt;
&lt;br /&gt;
# 原始两栖类和爬行类它们全身具肋骨，同时还具有不同形态，不同发达程度的双锥体，它们的椎弓位置也在变化，那么它们的肋骨是如何与脊椎相连的？希望有个总结。&lt;br /&gt;
# 肉鳍鱼亚纲基部类群皆无椎体结构，那么他们是否有肋骨？如果有他们是和鲟鱼一样与基腹弓片形成关节还是另有可能？&lt;br /&gt;
# 鸟类椎肋和胸肋之间的关节是否是用于呼吸，因为它椎肋被椎状突固定而胸肋又被龙骨突固定死，需要有活动胸廓的位置？&lt;br /&gt;
&lt;br /&gt;
任淑仙《无脊椎动物学（第二版）》P248讲节肢动物的复眼小眼时，在重叠像一段提到了“屏幕效应”，本人搜索无果，望众贤解答（虽然是小细节）&lt;br /&gt;
&lt;br /&gt;
关于折返激动，扑动，颤动等心律失常的介绍？&lt;br /&gt;
&lt;br /&gt;
求孢子纲系统发生上重要事件&lt;br /&gt;
&lt;br /&gt;
求一个各种动物的血小板或血栓细胞等的总结&lt;br /&gt;
&lt;br /&gt;
胆碱能性荨麻疹发病机制&lt;br /&gt;
&lt;br /&gt;
能不能整理一下解剖各种模式动物的方法步骤和注意事项&lt;br /&gt;
&lt;br /&gt;
哪些神经递质或激素对应的受体通过G蛋白βγ亚基进行信号转导（细胞书、生理书还有机构讲的都不完全一致）？&lt;br /&gt;
&lt;br /&gt;
关于园田螺的血色蛋白：&lt;br /&gt;
&lt;br /&gt;
猿辅导某套综合卷解析视频中给的总结是：园田螺无血色蛋白，依赖血清蛋白运输氧气&lt;br /&gt;
&lt;br /&gt;
而《普动》上写的是具有血蓝蛋白(P202)，上网搜查两种说法都能找到，所以实际上是什么呢？&lt;br /&gt;
&lt;br /&gt;
视杆细胞持续的阳离子内流到底是钠离子通道介导还是非选择性阳离子通道介导？胞生上说是非选择性阳离子通道，但是生理学原理和动物生理学上说的是钠离子通道&lt;br /&gt;
&lt;br /&gt;
两栖动物的肺是否能认为其具有肺泡？&lt;br /&gt;
&lt;br /&gt;
请问蚯蚓 有无蚯蚓血红蛋白？&lt;br /&gt;
&lt;br /&gt;
=== 动物行为学 ===&lt;br /&gt;
贝特曼原理（雄性竞争，雌性选择）为什么更多体现的是性内选择呢？&lt;br /&gt;
&lt;br /&gt;
蜜蜂访问豌豆花先接触那片花瓣&lt;br /&gt;
&lt;br /&gt;
负竞争和反竞争是什么概念，有什么例子吗&lt;br /&gt;
&lt;br /&gt;
=== 细胞生物学 ===&lt;br /&gt;
&lt;br /&gt;
求个CAR-T疗法历史的总结。&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
== 已解答 ==&lt;br /&gt;
&lt;br /&gt;
=== 植物学 ===&lt;br /&gt;
&lt;br /&gt;
==== 弹丝与假弹丝分别是几倍体： ====&lt;br /&gt;
除了吴国芳，马炜梁两本书上含混不清的阐述，我所见到全部其他资料都表示：弹丝，假弹丝都是二倍体。区别在于：弹丝是单细胞的，有螺纹的加厚，而假弹丝是多细胞连成的，无螺纹加厚。&lt;br /&gt;
&lt;br /&gt;
弹丝是小孢子母细胞不经过减数分裂形成，为2n；假弹丝是造孢细胞的子细胞连续有丝分裂形成(含2-4个细胞)，为2n&lt;br /&gt;
&lt;br /&gt;
==== 水韭的形成层： ====&lt;br /&gt;
这是一个至今仍有争议的问题。一般认为水韭有形成层，但只向内形成次生木质部，向外形成皮层而非韧皮部。[https://doi.org/10.1086/329874 参考文献]&lt;br /&gt;
&lt;br /&gt;
——答主的参考文献写的是&amp;quot;The cambium does not form phloem&amp;quot;？应该是形成层只形成次生木质部而不产生次生韧皮部才对啊？&lt;br /&gt;
&lt;br /&gt;
==== 2024年联赛有关禾本科颖片、稃片的一题有何问题 ====&lt;br /&gt;
根据马炜梁，四个选项都是苞片（见三版P382与P257）。按最新的分子证据，内稃外稃都是花被同源，因此怎么也犯不着选ABC。评议稿答案给ABC可能是因为很多机构是这么讲的。&lt;br /&gt;
&lt;br /&gt;
——根据陆时万，答案是ABC。还有一两本教材，也跟随了陆时万的说法。本以为这个题在通行的教材上有争议所以答案可能是遵循了最新的研究，没想到是最古早的陆时万的说法。我只能说出题人学的二五八万的还想考察别人。&lt;br /&gt;
&lt;br /&gt;
==== APG 分类系统较传统分类系统增加了哪些科级新类别？ ====&lt;br /&gt;
首先纠正一点，APG系统里面没有科的概念，都是单系群。叫科只是大家习惯这么说了而已。具体的改动比较明显的马炜梁已经讲过了。例如被压榨的百合科，移到石蒜科的葱属，原玄参科现在泡桐科的泡桐，新加的车前科；还有很多被并入或拆分的科，例如原忍冬科的荚蒾属接骨木属被并入五福花科，椴树科、梧桐科、木棉科的植物并入锦葵科，毛茛科的芍药升为芍药科。还有很多的细节，题主可以买一本浙大傅承新植物学第二版看看。改动特别明显且是必背科的有玄参科、百合科、锦葵科、天门冬科、忍冬科、五味子科。&lt;br /&gt;
&lt;br /&gt;
==== 石竹目胎座的演化关系？ ====&lt;br /&gt;
中轴胎座(石竹科麦瓶草属：中轴胎座，但子房室间隔在上部已消失，形成不完全的3室)→特立中央胎座(石竹科的大多数，子房室间隔消失)→基底胎座，胚珠减少→最终阶段：藜科(基底胎座，1胚珠，胞果)&lt;br /&gt;
&lt;br /&gt;
==== 菊科假舌状花是否可以结实？网上显示假舌状花属于雌花或中性花，理论上可以结实？若可以结实，请问哪些常见菊科植物的假舌状花属于雌花呢？谢谢！(类别：植物学) － 来自重庆某新高一生竞生 ====&lt;br /&gt;
雌性的可以，中性的不能。菊花就是边缘假舌状花和管状花都结实。见陆时万植物学修订版下册P315菊属第三行“雌性，假舌状，两者均结实”。再比如向日葵边缘的花就是中性的不能结实，没见过吃的瓜子有从边缘花摘的&lt;br /&gt;
&lt;br /&gt;
==== 关于地钱假根：马炜梁老师书P172图8-4a中将地钱配子体下表皮的多细胞结构称为鳞片，而浙大傅承新老师书P85图4-52中将其称为多细胞鳞片状假根，网上搜索结果显示该结构具有吸收功能，所以何者说法更准确？ ====&lt;br /&gt;
A1:个人觉得要真是考试用的话建议按马炜梁记，吸收功能的话马炜梁那本书应该也承认了有这个功能，傅承新的那本书做出这个结论也应该是基于功能的，不过也不排除有分子学证据支持两者同源的，只是目前我查到的非中文资料里没有几个特别强调“鳞片”和“假根”两个词的，倒是&amp;quot;rhizoids&amp;quot;（“根状体”）一词用的较多。&lt;br /&gt;
&lt;br /&gt;
A2:有一个首都师范大学做苔藓的博士说，多细胞的是鳞片，单细胞的是假根，陆时万的植物学认为两者都有吸收功能（很有限）&lt;br /&gt;
====苏铁叶算羽状复叶还是羽状深裂====&lt;br /&gt;
据多识植物百科，应为羽状深裂&lt;br /&gt;
&lt;br /&gt;
==== 植物孤雌生殖产生几倍体 ====&lt;br /&gt;
这个东西就涉及到一个争议性比较大（主要是主流教材写的都有些问题）的内容--无融合生殖。不过一般来说参考胡适宜先生的《被子植物生殖生物学》比较多些。这个问题就依胡适宜先生的观点解释了。&lt;br /&gt;
&lt;br /&gt;
单就“孤雌生殖”这个名词而言，是被归入了单倍体无融合生殖的，也就是说，这个植株是源于未受精的减数分裂后的细胞，因此其实产生的是单倍体植株而且大多不育。再细讲一点的话这个名词只局限于由单倍体的卵细胞发育成新植株，而由反足细胞和助细胞发育的我们称为无配子生殖。&lt;br /&gt;
&lt;br /&gt;
不过鉴于胡适宜先生的这本书并不是那么新，因此现在的业界观点是否改变并不好说，但偶数年还是以她的观点为依据的。&lt;br /&gt;
&lt;br /&gt;
顺道就补充一下无融合生殖咯：[[无融合生殖]]&lt;br /&gt;
&lt;br /&gt;
====请问次生虫媒传粉是什么东西（2016年联赛的解析里提到，垂柳是次生虫媒传粉，但没找到资料）====&lt;br /&gt;
&lt;br /&gt;
解答：参见杨柳科的系统发育，杨柳科的祖征是风媒传粉，而部分柳的虫媒传粉其实是其独立进化出的衍征，与被子植物的原始（初生）虫媒不同，自然可称为次生的虫媒传粉。&lt;br /&gt;
&lt;br /&gt;
=== 动物学 ===&lt;br /&gt;
&lt;br /&gt;
==== 同上书 P354讲苔藓动物胃绪(funiculus)时提到它由“间质细胞 ”形成，这与《普通动物学》等所讲（由体腔上皮形成）是否相违背？（虽然还是小细节） ====&lt;br /&gt;
首先搞清楚实质细胞和间质细胞的定义，这个组织或器官里面起功能的叫实质细胞，辅助功能的叫间质细胞，体腔上皮是一个组织，一个组织里面本来就有实质细胞和间质细胞。假定这里说的是体腔上皮细胞（实质细胞），那这俩本来不就挨在一起吗，还是一样的。看不出有什么冲突的点。&lt;br /&gt;
&lt;br /&gt;
另外形态学的观点，看着在哪就是哪，这种在一起的结构本来就说啥的都有。如果真想知道从哪里来可以自己做转录组和细胞谱系分析，虽然这也多半得到的结果是很迷惑，除了肝细胞、血细胞、生殖细胞，其它细胞的谱系都不是很清楚。&lt;br /&gt;
&lt;br /&gt;
==== 关于弓鳍鱼的鳞片：《普通动物学》“圆形硬鳞”；杨安峰《脊椎动物学》前后分别提到是圆鳞和硬鳞。应是哪个？ ====&lt;br /&gt;
（这个网站竟然SSL证书过期了，导致只能用Markdown编辑，气）题主竟然还有上古书籍杨安峰脊椎动物，正好我也有，那就回答一下吧。应该是&#039;&#039;&#039;硬鳞&#039;&#039;&#039;。首先可以去搜维基百科，因为不太会用Markdown就不放链接了，直接搜弓鳍鱼的词条即可，是硬鳞。题主所说的圆鳞估计来自于杨安峰P84吧，上面说的多鳍鱼目是圆鳞或硬鳞，但是在弓鳍鱼目明确指出了是硬鳞。普通动物学圆形硬鳞本质也是硬鳞。&lt;br /&gt;
话说什么时候这个网站才能恢复https访问，现在编辑起来好麻烦。&lt;br /&gt;
&lt;br /&gt;
==== 来自刘凌云《普通动物学》：P221上方表明十腕目左侧第5腕特化为茎化腕，而下方却说右侧。到底为哪一侧？ ====&lt;br /&gt;
任淑仙《无脊椎动物学》第二版p180:多数种类左侧（少数为右侧）第五腕，目前遇到的考试题大多表述为左侧第五腕，或许不严谨但一般也不算错&lt;br /&gt;
&lt;br /&gt;
随手补一点：&lt;br /&gt;
&lt;br /&gt;
十腕目：&lt;br /&gt;
&lt;br /&gt;
旋壳乌贼科：第五对腕均茎化&lt;br /&gt;
&lt;br /&gt;
乌贼科：左侧第五腕&lt;br /&gt;
&lt;br /&gt;
后耳乌贼科：左侧第五腕&lt;br /&gt;
&lt;br /&gt;
耳乌贼属：左侧第一腕&lt;br /&gt;
&lt;br /&gt;
僧头乌贼属：第一对腕均茎化&lt;br /&gt;
&lt;br /&gt;
微鳍乌贼科：第五对腕均茎化&lt;br /&gt;
&lt;br /&gt;
枪乌贼科：左侧第五腕茎化&lt;br /&gt;
&lt;br /&gt;
狭乌贼属：右侧第五腕茎化&lt;br /&gt;
&lt;br /&gt;
八腕目：&lt;br /&gt;
&lt;br /&gt;
十字蛸科：第一对腕均茎化&lt;br /&gt;
&lt;br /&gt;
单盘蛸科：右侧第三腕茎化&lt;br /&gt;
&lt;br /&gt;
章鱼科：右侧第三腕茎化&lt;br /&gt;
&lt;br /&gt;
船蛸科：左侧第三腕茎化&lt;br /&gt;
&lt;br /&gt;
以上只是列举几个例子，可见头足目茎化腕的情况，变化还是非常大的。不过整体而言，十腕左五八腕右三的规律是确切无疑的，普动可能是写错了。&lt;br /&gt;
&lt;br /&gt;
有些地方写第四对，是因为不把位于第四对的触腕看作腕，第五对茎化腕就成了第四对。&lt;br /&gt;
&lt;br /&gt;
以上信息来源十分古早，分类地位很可能改变，仅供娱乐，莫要上心。参考资料：张玺，齐钟彦，《贝类学纲要》，1961.&lt;br /&gt;
&lt;br /&gt;
==== 关于鸵鸟膀胱的类型：鸵鸟的膀胱是泄殖腔膀胱还是尿囊膀胱？ ====&lt;br /&gt;
不能想当然地认为是尿囊膀胱，鸵鸟的泄殖腔分为三个部分，粪道、泄殖道和肛道，粪道连接直肠，泄殖道有输尿管和生殖管开口，肛道开口于体外，背面有腔上囊；鸵鸟的泄殖道可以储存大量尿液，起到类似其他羊膜动物的膀胱的作用，因此严格来说鸵鸟也没有膀胱，不过书上还是普遍认为鸵鸟具有膀胱，那么就按来源属于泄殖腔膀胱。&lt;br /&gt;
&lt;br /&gt;
参考资料：[1] VERTEBRATES: COMPARATIVE ANATOMY, FUNCTION, EVOLUTION, EIGHTH EDITION， 2019&lt;br /&gt;
&lt;br /&gt;
[2]唐丽,彭克美,宋卉,位兰,王岩,李升和,杜安娜,靳二辉,王家乡.非洲雏鸵鸟泌尿系统的解剖学研究[J].野生动物,2006(05):35-37.&lt;br /&gt;
&lt;br /&gt;
==== 目前较为流行的动物学分类大致情况？（分蜕皮动物与冠轮动物的那一版） ====&lt;br /&gt;
[[文件:动物系统进化树.jpg|缩略图]]&lt;br /&gt;
→见右图&lt;br /&gt;
&lt;br /&gt;
（答主的图貌似有点老了，螺旋卵裂还全是未解决）&lt;br /&gt;
&lt;br /&gt;
现在螺旋卵裂分为有颚动物超门和扁虫冠轮动物两大支：&lt;br /&gt;
&lt;br /&gt;
①有颚动物超门包括颚口、微颚、轮虫、棘头四个原本在普动上写过的门（轮虫和棘头是一支，轮虫是个并系群，棘头成了轮虫下的一个目），毛颚动物目前可能要和有颚并到一支。&lt;br /&gt;
&lt;br /&gt;
②扁虫冠轮动物分出两支，一支归扁虫，一支归冠轮（像是废话），扁虫动物基部分支是中生动物（妹想到吧），之后的扁形动物和腹毛动物为姐妹群。&lt;br /&gt;
&lt;br /&gt;
③冠轮动物又进一步分为了两大支，一支是环节动物，有原本的多毛寡毛和蛭，还加上了星虫螠虫和西伯达虫，具体分的太乱，就不搞了，圆环动物门成了冠轮底下的未解决；&lt;br /&gt;
&lt;br /&gt;
④另一支分出软体动物和Kryptotrochozoa，翻译叫“氪金动物”（樂），包括触手冠动物（下分：腕足动物，含原腕足动物门和帚虫动物门；苔藓动物，含原内肛动物门及外肛动物门）和纽虫。&lt;br /&gt;
&lt;br /&gt;
——指正：Kryptotrochozoa应当翻译为“隐担轮动物”，希腊语kryptos代表隐藏的，Trochozoa代表担轮幼虫（trochophore larvae），即其幼虫是“隐藏的担轮幼虫”——发生改变但本质仍是担轮幼虫的辐轮幼虫(帚虫)、帽状幼虫(纽虫)、双壳幼虫(腕足)等等。&lt;br /&gt;
[[文件:目前基本公认的进化树.png|缩略图]]&lt;br /&gt;
（以上内容源自维基百科，其中一些分类群的定义尚有争议，但大致没错）&lt;br /&gt;
&lt;br /&gt;
==== 《无脊椎动物学》中写缠绕刺丝囊(spirocyst)仅珊瑚纲具有，但《普动》上写水螅具有卷缠刺丝囊(没写英文)，所以这两者是一个东西吗？如果不是，有什么区别？谢谢 ====&lt;br /&gt;
是一个东西，就是仅卷缠或分泌粘液，和穿刺刺丝囊区分&lt;br /&gt;
&lt;br /&gt;
==== 哪些无脊椎动物的血红（或血蓝之类）蛋白在血浆中，哪些又在血细胞中？ ====&lt;br /&gt;
非常值得总结的内容！敬请期待：[[有关呼吸色素的总结]]&lt;br /&gt;
&lt;br /&gt;
==== 青蛙如何分辨用于求偶的高频声音和用于警告的低频声音，它的听觉器官只为一个听斑，与行波理论不符？ ====&lt;br /&gt;
[[文件:Answer.png|左|缩略图|我就说翻译些外文教材有用]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
链接：[[第十七章 感觉器官]]&lt;br /&gt;
&lt;br /&gt;
==== 对报警外激素反应最强烈的工蜂年龄 ====&lt;br /&gt;
响应报警外激素的工蜂，接下来很可能在应对外敌的战斗中牺牲，所以垂垂老矣的老年工蜂会积极反应，而年少的工蜂还“大有可为”，不值得牺牲，响应就弱。&lt;br /&gt;
&lt;br /&gt;
==== 关于鱼类鳔体积调节与悬浮水层高度的问题：《比解》上明确写了当鱼稳定在深水层时，鳔内气体需要减少，而稳定在浅水层时需增加鳔内气体但是深水层中水压较大，压缩鱼体体积，减小浮力，鱼想要稳定在该水层中应当增加浮力才对，为何排气而非增加气体？ ====&lt;br /&gt;
你推理的是正确的，书上写错了。&lt;br /&gt;
&lt;br /&gt;
==== 什么是初生颌关节？和初生颌有什么关联？ ====&lt;br /&gt;
初生颌关节指方骨与关节骨之间（或腭方与麦氏之间）的，上下颌之间的关节。与之相对应的是哺乳类的齿骨与鳞骨之间形成的次生颌关节。&lt;br /&gt;
&lt;br /&gt;
而初生颌是指软骨鱼和某些基部硬骨鱼那样的麦氏软骨与腭方软骨起主要功能的颌，与之相对的是上下颌功能被加入的膜原骨替代的次生颌，起功能的骨头有前颌骨、上颌骨、齿骨、隅骨。&lt;br /&gt;
&lt;br /&gt;
=== 生物化学 ===&lt;br /&gt;
&lt;br /&gt;
==== dna与rna谁的密度大： ====&lt;br /&gt;
RNA的密度最大。&lt;br /&gt;
&lt;br /&gt;
DNA、RNA和蛋白质这三种生物大分子都具有一定的密度，其中&#039;&#039;&#039;RNA的密度最大&#039;&#039;&#039;，蛋白质的密度最低，DNA的密度介于两者之间的某一个位置。 一个特定的DNA分子的密度主要取决于它的GC含量和构象状态。 GC含量越高，密度越大。 与超螺旋结构存在的DNA密度显然要高于松弛状的DNA。 而变性的DNA密度要高于没有变性的DNA。&lt;br /&gt;
&lt;br /&gt;
附：“不同大分子的浮力密度也不同。DNA一般在1.7以上，RNA为1.6，蛋白质为1.35-1.40”此应为王镜岩第三版的错误，其第四版与比较新的教材已更正&lt;br /&gt;
&lt;br /&gt;
==== 多不饱和脂肪酸的氧化过程？ ====&lt;br /&gt;
有点意思哈~右边请！[[多不饱和脂肪酸的氧化]]&lt;br /&gt;
&lt;br /&gt;
==== 酶活力单位的定义是否有问题？ ====&lt;br /&gt;
误解主要从“所需”两字产生，删掉就好理解了。实际上就是一个速率，底物转化质量比时间m/t，只不过把这个速率用来表示酶量。比如1min这些酶（不管多少酶不管什么酶）转化了1μmol底物，那这些酶的量就是1U。相应的，如果1min这些酶转化了2μmol底物，那这些酶的量就是2U。实际上和底物相关，但是用于表示酶量。所以此“所需”非彼“所需”。在1min内转化1μmol底物需要1U酶，在1min内转化2μmol底物需要2U酶，没什么问题。至于提到的国内按什么来，国内外都是统一的，是国际酶学会订的（虽然现在酶学会更推荐用kat这个单位），做过实验动手算过就明白了。&lt;br /&gt;
&lt;br /&gt;
==== from徐长法《生物化学》下册p90，真的有无脊椎动物体内存在乙醛酸循环吗？ ====&lt;br /&gt;
解答：有。乙醛酸循环是植物和某些微生物（大肠杆菌、醋酸杆菌等）及一些无脊椎动物细胞内脂肪酸氧化分解为乙酰CoA之后，在乙醛酸循环体(glyoxysome)内生成琥珀酸、乙醛酸和苹果酸的过程。参见[https://baike.baidu.com/item/%E4%B9%99%E9%86%9B%E9%85%B8%E5%BE%AA%E7%8E%AF/619160 百度百科]（百度百科内容不一定正确，请辩证对待）&lt;br /&gt;
除了具有双功能融合 ICL-MS 基因的线虫，其他后生动物无。[https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1630690 后生动物乙醛酸循环酶的进化]&lt;br /&gt;
&lt;br /&gt;
==== 求一个关于金属酶/金属蛋白的整理。比如质膜ATP酶以Na为辅酶，精氨酸酶以Mn作为辅酶等等 ====&lt;br /&gt;
解答：先写了一点点。可以参考[https://zh.wikipedia.org/zh-hans/金属蛋白 金属蛋白]&lt;br /&gt;
&lt;br /&gt;
==== 所以反竞争性抑制剂有啥应用实例 ====&lt;br /&gt;
现实中几乎没有反竞争性抑制剂（见杨荣武生物化学原理），反竞争性抑制剂仅存在理论研究价值。&lt;br /&gt;
杨sir这里写的大概的确有问题：多见于多底物发生的生化反应中，在单一底物的酶促反应中不常见，例如L-同型精氨酸和L-苯丙氨酸等多种L-氨基酸是碱性磷酸酶的反竞争性抑制剂，它们能结合碱性磷酸酶与底物的复合物，并阻碍反应继续进行；此外，肼类化合物反竞争性抑制胃蛋白酶的活性，氰化物也是芳香硫酸酯酶的反竞争性抑制剂。&lt;br /&gt;
参考&lt;br /&gt;
SPECTOR T, HAJIAN G．Statistical methods to distinguish competitive, noncompetitive, and uncompetitive enzyme inhibitors．Analytical biochemistry，1981，115(2)：403-409．DODGSON K S, SPENCER B, WILLIAMS K．Examples of Anti-competitive Inhibition．Nature，1956，177(4505)：432-433．&lt;br /&gt;
《中国大百科全书》第三版网络版&lt;br /&gt;
&lt;br /&gt;
==== 为何盐析使用硫酸铵而非氯化钠氯化钾等？ ====&lt;br /&gt;
早期生物学家在做实验的时候发现有盐析现象，于是去找适合盐析的盐。找到最后觉得硫酸铵最好。当然不一定用硫酸铵，这个都取决于个人。毕竟盐析推荐用中性盐但是硫酸铵明显是个酸性盐但照样用。当然可以用氯化钠什么的但是效果不一定好（在家里可以把食盐撒到鸡蛋清上能看到有白色絮状沉淀）。这取决于盐的性质和待处理蛋白质的性质，有很大的多样性。&lt;br /&gt;
&lt;br /&gt;
补：今天遇到了段志贵教授，他告诉我另外一个点：硫酸铵溶解度非常大。&lt;br /&gt;
&lt;br /&gt;
话说这个问题背后的知识点还是比较复杂的。我讲两句。（咳）&lt;br /&gt;
&lt;br /&gt;
电荷密度高的离子，结合水分子的能力强，被称为“亲液的”Kosmotropic。&lt;br /&gt;
&lt;br /&gt;
电荷密度低的离子，就被称为“离液的”Chaotropic 。&lt;br /&gt;
&lt;br /&gt;
像磷酸根，硫酸根这样的多价离子，电荷多，电荷密度高，就是亲液剂；像碘离子、硫氰酸根离子，不光电荷少，分子还大，电荷密度低，就是离液剂。&lt;br /&gt;
&lt;br /&gt;
从亲液性强的排列到离液性强的离子，就成了Hofmeister序列。&lt;br /&gt;
&lt;br /&gt;
至少看起来，阳离子离液剂+阴离子亲液剂=盐析+不变性（SO&amp;lt;sub&amp;gt;4&amp;lt;/sub&amp;gt;&amp;lt;sup&amp;gt;2-&amp;lt;/sup&amp;gt;+NH&amp;lt;sub&amp;gt;4&amp;lt;/sub&amp;gt;&amp;lt;sup&amp;gt;+&amp;lt;/sup&amp;gt;），阴离子离液剂+阳离子亲液剂（SCN&amp;lt;sup&amp;gt;-&amp;lt;/sup&amp;gt;+胍）=盐溶+变性。&lt;br /&gt;
[[文件:Hofmeister serie.png|缩略图]]&lt;br /&gt;
这解释了为什么盐析用硫酸铵，而变性用异硫氰酸胍。显然这里面也有着成本、溶解性、避免形成难溶的沉淀物之类的考量。&lt;br /&gt;
&lt;br /&gt;
至于为什么，我的理解如下：蛋白质多为阴离子：&lt;br /&gt;
&lt;br /&gt;
* 如果阳离子为离液剂，此阳离子不愿结合水，反而会结合蛋白质：&lt;br /&gt;
** 蛋白质分子结合了相同的离子，相互排斥，不易沉淀，造成盐溶&lt;br /&gt;
** 结合了在蛋白质上的离子破坏了蛋白质的氢键，造成变性&lt;br /&gt;
* 如果阳离子是亲液剂，此阳离子希望结合水，便不管蛋白质：&lt;br /&gt;
** 水分子都被亲液剂结合，蛋白质缺水沉淀，造成盐析&lt;br /&gt;
** 蛋白质不会受到离子的影响，不会变性&lt;br /&gt;
* 如果阴阳离子都是亲液剂，阴阳离子互相结合而不结合水，减小总体亲液效果。&lt;br /&gt;
* 如果阴阳离子都是离液剂，阴阳离子不互相结合反而都去结合水，减小总体离液效果。&lt;br /&gt;
&lt;br /&gt;
以上是我个人的理解，不一定对，但肯定能够帮你记住这些规律😋&lt;br /&gt;
&lt;br /&gt;
==== b族维生素的组成明析 / vb8是肌醇还是腺嘌呤核苷酸  或者“生物素”（科普中国说的，笑） ====&lt;br /&gt;
[[文件:B族维生素.png|缩略图|B族维生素解析]]&lt;br /&gt;
见右侧图“B族维生素解析”&lt;br /&gt;
&lt;br /&gt;
注：此图为朱斌《生物竞赛专题精炼》P100，题主可自己看。另外这些都有争议，朱斌这里只是观点之一。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;沙林毒气的作用机理？（之前有看到说它是乙酰胆碱酯酶的自杀型抑制剂，但没有找到别的资料）&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
杨rw《生物化学原理》第三版p170  沙林即甲基氟磷酸异丙酯，是一种有机磷化物，可以共价修饰酶活性中心的丝氨酸残基的羟基使得其失活。沙林属于基团特异性抑制剂&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;Yang Sir的书上说“嘌呤环的嘧啶环和咪唑环之间有小的弯曲，故嘌呤环不完全在一个平面上”，但是根据本人浅薄的化学知识，C5和C4应当都是sp2杂化，为什么会出现弯曲呢（话说这是不是已经不是生物的范畴了）&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
环张力与键角矛盾 六元环的理想键角为120°，而五元环的理想键角约为108°。当两个环在C4和C5处稠合时，连接处的键角需要兼顾两种环的需求，导致局部键角偏离理想值（如压缩或拉伸），从而引发整体结构的扭曲。&lt;br /&gt;
共轭受限与定域化效应  尽管sp²杂化原子通常通过π共轭保持平面性，但在嘌呤中，五元环与六元环的共轭体系可能不完全连续。咪唑环的部分双键定域化（如C4-C5键的单双键特性交替），削弱了共轭的连续性，允许一定程度的弯曲。&lt;br /&gt;
孤对电子排斥与杂原子影响  嘧啶和咪唑环中的氮原子孤对电子占据不同杂化轨道（如嘧啶环的N1、N3为sp²杂化，咪唑环的N7、N9可能参与不同键合）。这些孤对电子的空间排斥可能进一步破坏平面性。&lt;br /&gt;
实验证据支持  X射线晶体学数据显示，嘌呤分子中嘧啶环与咪唑环之间存在约5°~10°的轻微弯曲（如咖啡因等衍生物），证实了结构的非完全平面性。这种弯曲在溶液中因分子振动可能更加显著。&lt;br /&gt;
&lt;br /&gt;
==== 根据周德庆《微生物学教程》，磺胺类药物抑制二氢蝶酸合成酶，但貌似一直说的是二氢叶酸合成酶，是一直说的都是错的吗？ ====&lt;br /&gt;
是的，确实是抑制二氢蝶酸合成酶。此内容也得到《微生物生物学》（霍乃蕊，余知和）的支持。&lt;br /&gt;
&lt;br /&gt;
=== 分子生物学 ===&lt;br /&gt;
&lt;br /&gt;
==== 想求证一下，“DNA复制执照因子假说”中“执照”因子主要成分是Mcm蛋白，这是否是那种DNA解旋酶？毕竟好像在信号通路那里曾出现过一个不是后期促进复合物的APC。 ====&lt;br /&gt;
解答：单说Mcm应该是同一个家族。真核生物DNA复制所用到的Mcm2-10同时负责调控复制启动，Mcm不结合DNA也不会开始复制。关于Mcm是否是执照因子的讨论见下：&lt;br /&gt;
&lt;br /&gt;
一个异议：杨荣武《生物化学原理》3rd中，执照因子应是Cdt10和Cdc6，这两者在之后的复制过程被回收或降解。在丁明孝.等《细胞生物学》5th中，细胞周期一章的图中，有对Cdt10和Cdc6的标注，并且和杨荣武书上的过程一致，因此，如果杨荣武改题，这个知识点可能会出现极大争议。&lt;br /&gt;
&lt;br /&gt;
↑杨荣武分子生物学第二版说执照因子是Cdt1和Cdc6，至于是否包括Mcm，杨sir没有正面回答这个问题，仅说明这两种蛋白会首先结合Mcm。不过按照pre-RC的定义，应该不包括Mcm。联赛假如出了建议按杨sir来，因为他可以改题。&lt;br /&gt;
&lt;br /&gt;
==== 来自杨荣武《分子生物学》:DNAP4被用作修复，且在正常生长时被诱导合成，那么为何它“易错”？ ====&lt;br /&gt;
DNAPIV合成效率不高，本来就是修复用的。易错可以引入更多突变，提高细胞生存率，并且参与SOS途径。SOS的时候细胞都快死了，哪还会在乎这点错误。&lt;br /&gt;
&lt;br /&gt;
==== 杨sir的分生第二版P216图6-6“RecBCD酶在同源重组中的作用”中，文字是“5&#039;-外切酶”但图看起来是核酸内切酶，请问应如何理解；以及杨sir在学堂在线上讲的分生课程讲的是RecBCD先同时发挥3&#039;-外切酶与5&#039;-外切酶活性，遇到χ序列后解链酶活性被激活，但他的《分子生物学（第二版）》讲的先发挥解链酶与3&#039;-外切酶活性，遇到χ序列后再发挥“5&#039;-外切酶（？）”活性，请问应参考哪种说法？ ====&lt;br /&gt;
集训时问了杨荣武，他说按学堂在线上说的来（即“RecBCD先同时发挥3&#039;-外切酶与5&#039;-外切酶活性，遇到χ序列后解链酶活性被激活”）。&amp;lt;small&amp;gt;同时杨sir透露他的分生要开始编新版（&amp;lt;/small&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==== RecBCD是否具有5’外切酶活性，各大教材措辞不同。 ====&lt;br /&gt;
杨sir本人说有（见上一条）&lt;br /&gt;
&lt;br /&gt;
=== 细胞生物学 ===&lt;br /&gt;
&lt;br /&gt;
==== from 徐长法《生物化学》下册p153，“不同蛋白O-糖基化的起始起点并不一致，有的在内质网，有的在内质网-高尔基体中间结构，也有的在内侧高尔基体”，这句话准确吗？也就是说不是像翟中和《细胞生物学》那样只在高尔基体进行吗？ ====&lt;br /&gt;
解答：这似乎是一个&amp;quot;有争议&amp;quot;的问题。观点一：①如题，但徐长法我没有看过不做评价（我看的是杨sir和王镜岩QwQ，大佬有看过的可以验证一下）。②有[https://zhuanlan.zhihu.com/p/213786542 这篇知乎文章]描述O-linked为大多发生在内质网，黏蛋白发生在高尔基体（这篇文章给出了参考文献，可以自行验证）。观点二：①翟中和描述的是N-linked在内质网和高尔基体发生，O-linked在高尔基体发生（但是他没有给出肯定的判断）。②杨sir分子生物学第二版P393说O-linked只发生在高尔基体，一个很直接的结论。个人认为应该只在高尔基体，因为相关的糖基转移酶分布在高尔基体上。（而且杨sir能改题，直接信杨sir啊）至于其它观点不知从何而来。至少我目前做过的题都是按照高尔基体来的。&lt;br /&gt;
&lt;br /&gt;
补充一下答主的回答：其实O-linked在胞质也可进行（非典型O-linked，由N-GlcNAc连接至Ser上而成，这在丁明孝.等《细胞生物学》5th中有进行描述），而且不典型的/非翟中和的O-linked有很多形式，按糖的种类分可以包括O-GalNAc、O-GlcNAc、O-Gal、O-Man、O-Fuc、O-Glc，后三种在维基百科中提到了，而且这三种是在内质网进行的（O-Man是在内质网起始，在高尔基体完成），因此，说在内质网应该是OK的。&lt;br /&gt;
&lt;br /&gt;
另外，朱斌还在他的书里写过Tyr的“O-linked”，杨荣武也曾在讲课的时候提到蛋白聚糖的“O-linked”，总之说法很多，有很多可拓展之处。（我把维基百科扒下来了，PDF自取：[[:文件:O-linked glycosylation.pdf|O-linked glycosylation---Wikipedia]]）&lt;br /&gt;
&lt;br /&gt;
==== P62提到ABC超家族用于转运分子，而P66又说CFTR属于ABC超家族，是否矛盾？ ====&lt;br /&gt;
解答：应该是翟中和的问题，他想说的小分子是小物质的意思，不是分子的意思。离子也可以。ABC超家族是很大一类蛋白，基本上什么类型的物质都能转运。（似乎CFTR在效果上是是一个需要用ATP开启的离子通道蛋白，结构上属ATP超家族）&lt;br /&gt;
&lt;br /&gt;
追问：ATP超家族又是啥ʕ•̫͡•ʔ&lt;br /&gt;
&lt;br /&gt;
解答：就是ABC超家族，ATP binding cassette superfamily.&lt;br /&gt;
&lt;br /&gt;
==== 癌细胞体外培养是否贴壁？ ====&lt;br /&gt;
不贴壁、无接触抑制（后者为前者原因，二者同为癌细胞区别于正常细胞的现象）&lt;br /&gt;
&lt;br /&gt;
这话说的，意思是癌细胞可以被悬浮培养吗？大概不能。一般的癌细胞最开始也是贴壁长成一层，只不过长满一层后不会接触抑制，会继续长成好几层。&lt;br /&gt;
&lt;br /&gt;
==== 鞘脂的合成部位（sER or Golgi&#039;&#039;&#039;）&#039;&#039;&#039; ====&lt;br /&gt;
详见[https://www.dxy.cn/bbs/newweb/pc/post/44006920 鞘脂]&lt;br /&gt;
&lt;br /&gt;
——神经酰胺在sER上合成，再转到高尔基体上合成鞘脂。&lt;br /&gt;
&lt;br /&gt;
==== 想问一下，真核生物的核糖体还有E位点吗？ ====&lt;br /&gt;
解答：有E位点。详见视频：https://www.bilibili.com/video/BV19w4m127QK/?spm_id_from=333.337.search-card.all.click&amp;amp;vd_source=86f4f9d6f47b1620e6f209f2a952173f&lt;br /&gt;
&lt;br /&gt;
==== 来自丁明孝.等《细胞生物学》5th：为何此书上写CFTR突变体是&amp;quot;gain of function&amp;quot;? ====&lt;br /&gt;
解答:个人见解,应为编辑错误，翟好像并未严格区分逗号与分号大小问题，分号中间的逗号改为句号即可理解&lt;br /&gt;
&lt;br /&gt;
====联会复合体的装配起始在什么时候？====&lt;br /&gt;
&lt;br /&gt;
偶线期，经过粗线期，在双线期解体&lt;br /&gt;
&lt;br /&gt;
====观察样品中酶活及其分布用何种包埋？====&lt;br /&gt;
&lt;br /&gt;
答：根据王金发编写的《细胞生物学实验指南》大概是冷冻包埋，但是我手边没这本书，等等我。&lt;br /&gt;
&lt;br /&gt;
==== 间体（中膜体，拟线粒体）存在于活细胞中吗，还是只是死细胞中人为造成的结构。关于这个问题有好多说法，找不到最新的文献解释 ====&lt;br /&gt;
人为造成，但重复性良好所以被误解很多年。详情请看The Very Reproducible (But Illusory) Mesosome&lt;br /&gt;
&lt;br /&gt;
=== 生理学 ===&lt;br /&gt;
&lt;br /&gt;
==== 关于不同离子转运蛋白耗能多少及转运离子数量的总结？ ====&lt;br /&gt;
刚刚写了一点点，还有好多好多内容需要补充→&#039;&#039;&#039;[[载体蛋白和通道蛋白]]&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==== 朱大年《生理学》第九版P295表格中提到本体感觉属于Aα型神经纤维，但是P325却提到肌梭的传入神经包括Ia和II类纤维，其中花枝末梢是II类纤维的末梢且负责本体感觉。已知II类纤维属于Aβ类纤维，前后是否矛盾？John G. Nicholls等《神经生物学》第五版也有肌梭Ia型和II型纤维分别是“动态”和“静态”的传入纤维，是否可类比“肌梭长度感觉”和“本体感觉”？那朱P295表格是否表述不妥？ ====&lt;br /&gt;
解答：ABC和 I II III IV是分别两个分类系统，其中ABC多用于传出纤维的分类，I II III IV 多用于传入纤维的分类（不绝对，多用于而已）这个地方就是Aα为支配梭外肌传出纤维、初级肌梭传入纤维（本体感觉）。题主所表述的II类纤维属于Aβ的表述是不妥的，因为根本不是一个分类系统。Aβ多为皮肤触压觉传入纤维。分类标准的话ABC主要按照传导速度，I II III IV主要按照纤维直径。关于分类[https://zhuanlan.zhihu.com/p/68321428 可见这里]，当然这些内容朱大年也写过。&lt;br /&gt;
&lt;br /&gt;
追问《生理学》关于肌梭的传入纤维：抽象的是朱大年的表格上把两种分类系统对比了一下说Aα对应Ia和Ib，Aβ对应II……&lt;br /&gt;
&lt;br /&gt;
解答：在肌紧张里面α运动神经纤维不就是Aα吗。首先注意朱大年是这么写的“I II III IV类纤维分别相当于Aα Aβ Aδ C类&#039;&#039;&#039;后根纤维&#039;&#039;&#039;，但又&#039;&#039;&#039;不完全等同&#039;&#039;&#039;”，所以先不要把两种分类混一起。Aα负责肌肉本体感觉应该是没有争议的。II类纤维朱大年只表述了“可能有关”。其实Ia类神经纤维也负责肌肉本体感觉。&lt;br /&gt;
&lt;br /&gt;
==== 哺乳动物成熟红细胞裂解后,正常小泡和外翻性小泡的形成过程 ====&lt;br /&gt;
解答：红细胞受低渗影响破裂形成血影（残留的膜骨架＋膜），膜重新闭合时可能形成正常小泡或外翻性小泡&lt;br /&gt;
&lt;br /&gt;
==== 关于血液湍流的发生以及此时的血液黏度和血流切率，个人感觉朱大年生理学P116-117上的说法有些矛盾（下列一二）====&lt;br /&gt;
# 在血液黏度低的时候容易形成湍流 &lt;br /&gt;
# 血流切率越高，层流现象越明显，即血流黏度较低；相反当血流切率较低的时候，血液黏度高&lt;br /&gt;
想问一下湍流发生的时候，血液黏度究竟是高是低？血流切率又是怎样的呢？谢谢！&lt;br /&gt;
朱大年教材中的两个表述并不矛盾，而是从不同角度描述：&lt;br /&gt;
黏度低易湍流：强调黏度对Re的直接影响（普遍规律）。&lt;br /&gt;
高切率→低黏度→层流明显：指在未达临界Re时，高切率下剪切稀化使层流更稳定；但若Re超过临界值（如高流速），仍会发展为湍流。&lt;br /&gt;
&lt;br /&gt;
==== 肾素和抗利尿激素的作用都是减少尿量，从而使循环血量增多即升高血压，但为什么抗利尿激素抑制肾素的分泌呢？ ====&lt;br /&gt;
类似负反馈，因为AngII促进ADH分泌&lt;br /&gt;
&lt;br /&gt;
=== 植物生理学 ===&lt;br /&gt;
&lt;br /&gt;
==== 为什么植物细胞将质子泵出去，再让钾离子进来这一过程对细胞水势下降有贡献？理论上来说不是相同数量的钾离子进来后就进不来了吗？ ====&lt;br /&gt;
追问《植物生理学》水势：我的意思是，假如泵出去10个质子，不是只会进来10个钾离子就结束了吗？和氯离子没有关系吧？&lt;br /&gt;
&lt;br /&gt;
解答：在气孔打开时，H+-atp酶会将质子泵出去，氯离子会伴随着钾离子的大量吸收而吸收，于是会导致细胞水势下降。（可见王小菁第八版P25）&lt;br /&gt;
&lt;br /&gt;
↑补充答主回答：质子对水势贡献不大，更多的是通过电荷把钾离子带进来。钾离子和蔗糖是对细胞水势有更大贡献的（见Taiz 5th）。因此相同电荷的质子出去，电荷的钾离子进来，电荷守恒的同时降低了细胞内的水势。答主所说的氯离子我暂时没有找到出处，暂留异议。&lt;br /&gt;
&lt;br /&gt;
另：据苗健老师：玉米黄素并不是介导气孔开放的蓝光受体，应该是向光素介导的磷酸化途径。Taiz 7th已经删除了关于玉米黄素对气孔影响的文字，改成了向光素。但是因为国内教材都是抄的5th与6th所以都写的有玉米黄素。算是对水势的一个补充吧。这里有Taiz 7th的电子书（英文原版，&#039;&#039;&#039;856MB&#039;&#039;&#039;较大，建议开启浏览器自带多线程下载（不会自行百度）或使用IDM进行下载）：[https://cpucd.cpuikuns.top/s/GOia 分享-Plants Physi...]&lt;br /&gt;
&lt;br /&gt;
追问植物生理学那个问题：“在标准压力下，溶液的渗透势等于溶液的水势，因为溶液的压力势为0MPa。溶液的的渗透势决定于溶液中溶质颗粒（分子或离子）总数。”&lt;br /&gt;
钾离子贡献更大，是因为质子可能与有机酸等结合，相对来说颗粒总数更少吗？&lt;br /&gt;
&lt;br /&gt;
↑（个人见解，如有错误请佬指出）质子在此处的作用可以分为两部分：1）通过膜内外电位的改变使得钾离子通道开放，钾离子内流；2）质子-氯离子同向转运（见Taiz 5th，顺便解决了上一个补充回答的异议）。若是单纯质子的产生而不泵出显然无法做到这两点。所以，钾离子、质子、氯离子三者便均参与了水势的降低。另外，根据戈德曼方程可知虽然钾离子的浓度是胞内大于胞外，但电势是胞外大于胞内的。&lt;br /&gt;
&lt;br /&gt;
==== 请问有没有关于植物激素互作（比如乙烯调控IAA和JA及其下游基因）的总结，谢谢 ====&lt;br /&gt;
比较简要的总结，内容大部分来自王小菁《植物生理学（第8版）》，小部分来自网络等：&lt;br /&gt;
&lt;br /&gt;
===== 协同作用： =====&lt;br /&gt;
生长素&amp;amp;赤霉素-促进果实生长&lt;br /&gt;
&lt;br /&gt;
细胞分裂素&amp;amp;多胺-形成层分化&lt;br /&gt;
&lt;br /&gt;
独角金内酯&amp;amp;细胞分裂素-侧根生长&lt;br /&gt;
&lt;br /&gt;
独角金内酯&amp;amp;油菜素甾醇-侧根生长&lt;br /&gt;
&lt;br /&gt;
系统素（多肽激素）&amp;amp;茉莉素-抑制蛋白酶（在植物受病虫害时抑制植物蛋白的降解，保护尚未受伤的组织）&lt;br /&gt;
&lt;br /&gt;
乙烯&amp;amp;茉莉素-诱导抗病基因表达&lt;br /&gt;
&lt;br /&gt;
===== 促进作用： =====&lt;br /&gt;
生长素→乙烯产生&lt;br /&gt;
&lt;br /&gt;
脱落酸→果实产生乙烯&lt;br /&gt;
&lt;br /&gt;
茉莉素→乙烯合成&lt;br /&gt;
&lt;br /&gt;
===== 拮抗作用： =====&lt;br /&gt;
赤霉素&amp;amp;脱落酸-平衡种子发芽&lt;br /&gt;
&lt;br /&gt;
独角金内酯&amp;amp;脱落酸-侧芽生长&lt;br /&gt;
&lt;br /&gt;
多胺&amp;amp;乙烯-竞争前体（SAM）&lt;br /&gt;
&lt;br /&gt;
植物生长促进剂（生长素、赤霉素、细胞分裂素、乙烯）&amp;amp;植物生长抑制剂（脱落酸、水杨酸、茉莉素）-逆转促进/抑制作用&lt;br /&gt;
&lt;br /&gt;
===== 抑制作用： =====&lt;br /&gt;
细胞分裂素→生长素-抑制顶端优势&lt;br /&gt;
&lt;br /&gt;
乙烯→生长素-抑制转运&lt;br /&gt;
&lt;br /&gt;
脱落酸→生长素-抑制运输&lt;br /&gt;
&lt;br /&gt;
水杨酸→乙烯-抑制ACC转变为乙烯&lt;br /&gt;
&lt;br /&gt;
茉莉酸→乙烯对黄化苗顶端弯勾形成的促进作用&lt;br /&gt;
&lt;br /&gt;
乙烯→茉莉酸介导的植物伤害防御反应（通过加强茉莉酸代谢）&lt;br /&gt;
&lt;br /&gt;
=== 进化生物学 ===&lt;br /&gt;
&lt;br /&gt;
==== fay and wu 的H 较tajima的d的优点？ ====&lt;br /&gt;
鉴于这两个我一个都不会算，于是去查维基百科，得到的结果如下：&lt;br /&gt;
&lt;br /&gt;
①两者都是借由计算差异位点（分离位点S）数目和采样对之间核苷酸差异的数量（这些称为成对差异）这些数据计算群体遗传参数θ后统计得出的统计量，前面的计算过程基本一致，只是最后的统计量采用了不同表示方法；&lt;br /&gt;
&lt;br /&gt;
②相较于D，H的优点在于，当群体内含有过多罕见多态性时，H能够在D的基础上给出在此情况下进化的方式（例如选择性清除等等），而不是仅仅给出非随机进化的结论，这个优势是基于H参考了外群数据，因此纳入了祖先性状，若与祖先性状一致则该位点可能是经历了负选择等等&lt;br /&gt;
&lt;br /&gt;
（当然这都是维基百科说的，[[:文件:Genetics1405.pdf|原文]]里面没看懂哪有外群，不过确实是区别了选择性清除和其他因素，至于计算这块儿我就爱莫能助了）&lt;br /&gt;
&lt;br /&gt;
=== 遗传学 ===&lt;br /&gt;
&lt;br /&gt;
==== 求优势对数计分法中Lod值与连锁情况的对应关系 ====&lt;br /&gt;
Lod&amp;gt;3存在显著的连锁关系，Lod&amp;gt;1存在连锁，Lod&amp;lt;-2无连锁（参见戴灼华3th ed，标准意义上这不是生信问题qwq）&lt;br /&gt;
[[文件:半不育.png|缩略图]]&lt;br /&gt;
&lt;br /&gt;
==== 有关平衡易位杂合体“半不育”的疑问：理论上来说平衡易位杂合体可产生六种配子，其中仅两种是相间分离产生，即1/3配子可育而2/3配子不育。书上的叙述是利用50%配子不育的现象提出了易位，说明半不育是实验观察到的结果，是否有合理的解释为何1/3的可育配子在实际情况下变为50%可育？(来自重庆某高一生竞生） ====&lt;br /&gt;
如右图所示，平衡易位杂合体确实存在3种分离方式，但其发生概率并不相同；对于导致可育配子的相间分离和导致不育配子的相邻分离-1而言，其同源着丝粒相互分开，慨率较大且相等；对于导致不育的相邻分离-2而言，其同源着丝粒之间不分开，比较罕见。&lt;br /&gt;
&lt;br /&gt;
因此大体上看，主要会注意到相间分离和相邻分离-1，看起来确实接近一半的配子不育。&lt;br /&gt;
&lt;br /&gt;
==== 单倍体和一倍体明显的差异是什么呢？ ====&lt;br /&gt;
一倍和单倍这两个术语之间的区别微妙： 一倍染色体组是在多倍体系列的物种(如菊属)中成倍增加的基本染色体组。 单倍染色体组是存在于配子中的染色体集合，不管该物种的染色体数目是多少。 因为在二倍体生物中，一倍染色体组和单倍染色体组是一样的，所以可能出现混淆。想一 想四倍体，有助于弄清这一区别：四倍体含四个一倍染色体组，因而单倍体配子是二倍体。&lt;br /&gt;
&lt;br /&gt;
=== 生物技术 ===&lt;br /&gt;
&lt;br /&gt;
==== 如何制备emsa所用核酸探针？ ====&lt;br /&gt;
解答：要做EMSA首先要有参考基因组，然后化学合成/不对称PCR即可？&lt;br /&gt;
&lt;br /&gt;
=== 生态学 ===&lt;br /&gt;
&lt;br /&gt;
==== 生态学中用相邻个体最小距离检验分布型时，D=1/ (2N^{1/2})公式的推导过程？ ====&lt;br /&gt;
[[文件:屏幕截图 2024-11-14 190159.png|缩略图]]&lt;br /&gt;
（或许公式可以重新改一下下？有点不太明白）&lt;br /&gt;
&lt;br /&gt;
解答：&lt;br /&gt;
&lt;br /&gt;
在泊松分布中，有零个个体分布在指定的半径为r的区域内的概率P(零)=exp{-λπr²}&lt;br /&gt;
&lt;br /&gt;
因此，P(R≤r)=1-exp{-λπr²}&lt;br /&gt;
&lt;br /&gt;
其概率密度函数f(r)=2λπrexp{-λπr²} （根据P(x＜a)=∫(0→a)(f(x)) dx）&lt;br /&gt;
&lt;br /&gt;
所以距离的期望E(r)=∫(0→∞)r×f(r) dr=∫(0→∞)2λπr²exp{-λπr²} dr=1/(2λ^{1/2}).&lt;br /&gt;
&lt;br /&gt;
(该积分换元后使用Γ函数计算)（λ在这里表示分布密度，即图中的N）&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E6%8F%90%E5%87%BA%E4%BD%A0%E7%9A%84%E9%97%AE%E9%A2%98&amp;diff=4314</id>
		<title>提出你的问题</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E6%8F%90%E5%87%BA%E4%BD%A0%E7%9A%84%E9%97%AE%E9%A2%98&amp;diff=4314"/>
		<updated>2025-03-06T11:11:54Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;br /&gt;
应该有不少生物竞赛的学生在访问这个网站。为此创建这样一个页面。&lt;br /&gt;
&lt;br /&gt;
提问者：注册一个账号即可编辑，请在“未解答”栏目写下你学竞赛的问题，请注明身份。&lt;br /&gt;
&lt;br /&gt;
回答者：大佬们可以访问这个页面来查看有没有新的问题。如果您可以解答，请在问题下方编辑（没有编辑按钮就去登录）好回答，并将该词条转移到“已解答”栏目。&lt;br /&gt;
&lt;br /&gt;
或者也可以在这里提出您需要的整理。&lt;br /&gt;
&lt;br /&gt;
建议大家回答问题的时候标注一下知识来源&lt;br /&gt;
&lt;br /&gt;
== 未解答 ==&lt;br /&gt;
&lt;br /&gt;
=== 遗传学 ===&lt;br /&gt;
累加作用，积加作用，叠加作用在遗传比例方面的区别是什么呢？&lt;br /&gt;
&lt;br /&gt;
=== 生物化学 ===&lt;br /&gt;
&lt;br /&gt;
甲酰CoA在人体中是怎么代谢的？&lt;br /&gt;
&lt;br /&gt;
异亮氨酸与α螺旋的破坏关联性强不强&lt;br /&gt;
&lt;br /&gt;
=== 生态学 ===&lt;br /&gt;
=== 生物信息 ===&lt;br /&gt;
人类进化分析为何不用x或常染色体？&lt;br /&gt;
&lt;br /&gt;
如何在uniprot中查询蛋白复合体的结构？如果不能，有什么组装蛋白复合体的软件？&lt;br /&gt;
&lt;br /&gt;
=== 分子生物学 ===&lt;br /&gt;
链霉溶菌素和利链霉素是一个东西吗？（根据找到的资料，它们都作用于RNA聚合酶的核心酶β亚基，抑制转录延伸）&lt;br /&gt;
&lt;br /&gt;
=== 植物及生理学 ===&lt;br /&gt;
飞廉的刺是茎刺还是叶刺？&lt;br /&gt;
&lt;br /&gt;
空球藻的细胞之间有没有胞间连丝？&lt;br /&gt;
&lt;br /&gt;
叶片的发育过程中，是叶基部先成熟，还是叶尖部先成熟呢？&lt;br /&gt;
&lt;br /&gt;
关于蕨类的幼叶拳卷现象，是大多数蕨类都有？还是只有真蕨亚门有呢？有哪些蕨类没有？&lt;br /&gt;
&lt;br /&gt;
乙醇酸氧化酶和黄素氧化剂酶的区别？详细些的求求了（末端氧化酶）&lt;br /&gt;
&lt;br /&gt;
抗坏血酸氧化的磷氧比为什么是1呢？&lt;br /&gt;
&lt;br /&gt;
想问一下有没有关于光合电子传递链抑制剂及其作用部位的整理，谢谢！&lt;br /&gt;
&lt;br /&gt;
为什么有些植物的花是闭花授粉，但授粉完成后还会开放呢？(如豌豆)&lt;br /&gt;
&lt;br /&gt;
看图要怎么区分假年轮和年轮？&lt;br /&gt;
=== 动物及生理学 ===&lt;br /&gt;
关于应激反应和应急反应，参加反应的激素有哪些区别呢？&lt;br /&gt;
&lt;br /&gt;
关于乌贼的石灰质内壳，应该是来源于外套膜的分泌，同时体内出现了中胚层形成的软骨，为什么说石灰质内壳是外、中胚层来源的呢？&lt;br /&gt;
&lt;br /&gt;
肋骨三问：&lt;br /&gt;
&lt;br /&gt;
# 原始两栖类和爬行类它们全身具肋骨，同时还具有不同形态，不同发达程度的双锥体，它们的椎弓位置也在变化，那么它们的肋骨是如何与脊椎相连的？希望有个总结。&lt;br /&gt;
# 肉鳍鱼亚纲基部类群皆无椎体结构，那么他们是否有肋骨？如果有他们是和鲟鱼一样与基腹弓片形成关节还是另有可能？&lt;br /&gt;
# 鸟类椎肋和胸肋之间的关节是否是用于呼吸，因为它椎肋被椎状突固定而胸肋又被龙骨突固定死，需要有活动胸廓的位置？&lt;br /&gt;
&lt;br /&gt;
任淑仙《无脊椎动物学（第二版）》P248讲节肢动物的复眼小眼时，在重叠像一段提到了“屏幕效应”，本人搜索无果，望众贤解答（虽然是小细节）&lt;br /&gt;
&lt;br /&gt;
关于折返激动，扑动，颤动等心律失常的介绍？&lt;br /&gt;
&lt;br /&gt;
求孢子纲系统发生上重要事件&lt;br /&gt;
&lt;br /&gt;
求一个各种动物的血小板或血栓细胞等的总结&lt;br /&gt;
&lt;br /&gt;
胆碱能性荨麻疹发病机制&lt;br /&gt;
&lt;br /&gt;
能不能整理一下解剖各种模式动物的方法步骤和注意事项&lt;br /&gt;
&lt;br /&gt;
哪些神经递质或激素对应的受体通过G蛋白βγ亚基进行信号转导（细胞书、生理书还有机构讲的都不完全一致）？&lt;br /&gt;
&lt;br /&gt;
关于园田螺的血色蛋白：&lt;br /&gt;
&lt;br /&gt;
猿辅导某套综合卷解析视频中给的总结是：园田螺无血色蛋白，依赖血清蛋白运输氧气&lt;br /&gt;
&lt;br /&gt;
而《普动》上写的是具有血蓝蛋白(P202)，上网搜查两种说法都能找到，所以实际上是什么呢？&lt;br /&gt;
&lt;br /&gt;
视杆细胞持续的阳离子内流到底是钠离子通道介导还是非选择性阳离子通道介导？胞生上说是非选择性阳离子通道，但是生理学原理和动物生理学上说的是钠离子通道&lt;br /&gt;
&lt;br /&gt;
两栖动物的肺是否能认为其具有肺泡？&lt;br /&gt;
&lt;br /&gt;
请问蚯蚓 有无蚯蚓血红蛋白？&lt;br /&gt;
&lt;br /&gt;
=== 动物行为学 ===&lt;br /&gt;
贝特曼原理（雄性竞争，雌性选择）为什么更多体现的是性内选择呢？&lt;br /&gt;
&lt;br /&gt;
蜜蜂访问豌豆花先接触那片花瓣&lt;br /&gt;
&lt;br /&gt;
负竞争和反竞争是什么概念，有什么例子吗&lt;br /&gt;
&lt;br /&gt;
=== 细胞生物学 ===&lt;br /&gt;
&lt;br /&gt;
求个CAR-T疗法历史的总结。&lt;br /&gt;
=== 生态学 ===&lt;br /&gt;
求英美学派，法瑞学派，前苏联学派和北欧学派的区别qwq&lt;br /&gt;
----&lt;br /&gt;
&lt;br /&gt;
== 已解答 ==&lt;br /&gt;
&lt;br /&gt;
=== 植物学 ===&lt;br /&gt;
&lt;br /&gt;
==== 弹丝与假弹丝分别是几倍体： ====&lt;br /&gt;
除了吴国芳，马炜梁两本书上含混不清的阐述，我所见到全部其他资料都表示：弹丝，假弹丝都是二倍体。区别在于：弹丝是单细胞的，有螺纹的加厚，而假弹丝是多细胞连成的，无螺纹加厚。&lt;br /&gt;
&lt;br /&gt;
弹丝是小孢子母细胞不经过减数分裂形成，为2n；假弹丝是造孢细胞的子细胞连续有丝分裂形成(含2-4个细胞)，为2n&lt;br /&gt;
&lt;br /&gt;
==== 水韭的形成层： ====&lt;br /&gt;
这是一个至今仍有争议的问题。一般认为水韭有形成层，但只向内形成次生木质部，向外形成皮层而非韧皮部。[https://doi.org/10.1086/329874 参考文献]&lt;br /&gt;
&lt;br /&gt;
——答主的参考文献写的是&amp;quot;The cambium does not form phloem&amp;quot;？应该是形成层只形成次生木质部而不产生次生韧皮部才对啊？&lt;br /&gt;
&lt;br /&gt;
==== 2024年联赛有关禾本科颖片、稃片的一题有何问题 ====&lt;br /&gt;
根据马炜梁，四个选项都是苞片（见三版P382与P257）。按最新的分子证据，内稃外稃都是花被同源，因此怎么也犯不着选ABC。评议稿答案给ABC可能是因为很多机构是这么讲的。&lt;br /&gt;
&lt;br /&gt;
——根据陆时万，答案是ABC。还有一两本教材，也跟随了陆时万的说法。本以为这个题在通行的教材上有争议所以答案可能是遵循了最新的研究，没想到是最古早的陆时万的说法。我只能说出题人学的二五八万的还想考察别人。&lt;br /&gt;
&lt;br /&gt;
==== APG 分类系统较传统分类系统增加了哪些科级新类别？ ====&lt;br /&gt;
首先纠正一点，APG系统里面没有科的概念，都是单系群。叫科只是大家习惯这么说了而已。具体的改动比较明显的马炜梁已经讲过了。例如被压榨的百合科，移到石蒜科的葱属，原玄参科现在泡桐科的泡桐，新加的车前科；还有很多被并入或拆分的科，例如原忍冬科的荚蒾属接骨木属被并入五福花科，椴树科、梧桐科、木棉科的植物并入锦葵科，毛茛科的芍药升为芍药科。还有很多的细节，题主可以买一本浙大傅承新植物学第二版看看。改动特别明显且是必背科的有玄参科、百合科、锦葵科、天门冬科、忍冬科、五味子科。&lt;br /&gt;
&lt;br /&gt;
==== 石竹目胎座的演化关系？ ====&lt;br /&gt;
中轴胎座(石竹科麦瓶草属：中轴胎座，但子房室间隔在上部已消失，形成不完全的3室)→特立中央胎座(石竹科的大多数，子房室间隔消失)→基底胎座，胚珠减少→最终阶段：藜科(基底胎座，1胚珠，胞果)&lt;br /&gt;
&lt;br /&gt;
==== 菊科假舌状花是否可以结实？网上显示假舌状花属于雌花或中性花，理论上可以结实？若可以结实，请问哪些常见菊科植物的假舌状花属于雌花呢？谢谢！(类别：植物学) － 来自重庆某新高一生竞生 ====&lt;br /&gt;
雌性的可以，中性的不能。菊花就是边缘假舌状花和管状花都结实。见陆时万植物学修订版下册P315菊属第三行“雌性，假舌状，两者均结实”。再比如向日葵边缘的花就是中性的不能结实，没见过吃的瓜子有从边缘花摘的&lt;br /&gt;
&lt;br /&gt;
==== 关于地钱假根：马炜梁老师书P172图8-4a中将地钱配子体下表皮的多细胞结构称为鳞片，而浙大傅承新老师书P85图4-52中将其称为多细胞鳞片状假根，网上搜索结果显示该结构具有吸收功能，所以何者说法更准确？ ====&lt;br /&gt;
A1:个人觉得要真是考试用的话建议按马炜梁记，吸收功能的话马炜梁那本书应该也承认了有这个功能，傅承新的那本书做出这个结论也应该是基于功能的，不过也不排除有分子学证据支持两者同源的，只是目前我查到的非中文资料里没有几个特别强调“鳞片”和“假根”两个词的，倒是&amp;quot;rhizoids&amp;quot;（“根状体”）一词用的较多。&lt;br /&gt;
&lt;br /&gt;
A2:有一个首都师范大学做苔藓的博士说，多细胞的是鳞片，单细胞的是假根，陆时万的植物学认为两者都有吸收功能（很有限）&lt;br /&gt;
====苏铁叶算羽状复叶还是羽状深裂====&lt;br /&gt;
据多识植物百科，应为羽状深裂&lt;br /&gt;
&lt;br /&gt;
==== 植物孤雌生殖产生几倍体 ====&lt;br /&gt;
这个东西就涉及到一个争议性比较大（主要是主流教材写的都有些问题）的内容--无融合生殖。不过一般来说参考胡适宜先生的《被子植物生殖生物学》比较多些。这个问题就依胡适宜先生的观点解释了。&lt;br /&gt;
&lt;br /&gt;
单就“孤雌生殖”这个名词而言，是被归入了单倍体无融合生殖的，也就是说，这个植株是源于未受精的减数分裂后的细胞，因此其实产生的是单倍体植株而且大多不育。再细讲一点的话这个名词只局限于由单倍体的卵细胞发育成新植株，而由反足细胞和助细胞发育的我们称为无配子生殖。&lt;br /&gt;
&lt;br /&gt;
不过鉴于胡适宜先生的这本书并不是那么新，因此现在的业界观点是否改变并不好说，但偶数年还是以她的观点为依据的。&lt;br /&gt;
&lt;br /&gt;
顺道就补充一下无融合生殖咯：[[无融合生殖]]&lt;br /&gt;
&lt;br /&gt;
====请问次生虫媒传粉是什么东西（2016年联赛的解析里提到，垂柳是次生虫媒传粉，但没找到资料）====&lt;br /&gt;
&lt;br /&gt;
解答：参见杨柳科的系统发育，杨柳科的祖征是风媒传粉，而部分柳的虫媒传粉其实是其独立进化出的衍征，与被子植物的原始（初生）虫媒不同，自然可称为次生的虫媒传粉。&lt;br /&gt;
&lt;br /&gt;
=== 动物学 ===&lt;br /&gt;
&lt;br /&gt;
==== 同上书 P354讲苔藓动物胃绪(funiculus)时提到它由“间质细胞 ”形成，这与《普通动物学》等所讲（由体腔上皮形成）是否相违背？（虽然还是小细节） ====&lt;br /&gt;
首先搞清楚实质细胞和间质细胞的定义，这个组织或器官里面起功能的叫实质细胞，辅助功能的叫间质细胞，体腔上皮是一个组织，一个组织里面本来就有实质细胞和间质细胞。假定这里说的是体腔上皮细胞（实质细胞），那这俩本来不就挨在一起吗，还是一样的。看不出有什么冲突的点。&lt;br /&gt;
&lt;br /&gt;
另外形态学的观点，看着在哪就是哪，这种在一起的结构本来就说啥的都有。如果真想知道从哪里来可以自己做转录组和细胞谱系分析，虽然这也多半得到的结果是很迷惑，除了肝细胞、血细胞、生殖细胞，其它细胞的谱系都不是很清楚。&lt;br /&gt;
&lt;br /&gt;
==== 关于弓鳍鱼的鳞片：《普通动物学》“圆形硬鳞”；杨安峰《脊椎动物学》前后分别提到是圆鳞和硬鳞。应是哪个？ ====&lt;br /&gt;
（这个网站竟然SSL证书过期了，导致只能用Markdown编辑，气）题主竟然还有上古书籍杨安峰脊椎动物，正好我也有，那就回答一下吧。应该是&#039;&#039;&#039;硬鳞&#039;&#039;&#039;。首先可以去搜维基百科，因为不太会用Markdown就不放链接了，直接搜弓鳍鱼的词条即可，是硬鳞。题主所说的圆鳞估计来自于杨安峰P84吧，上面说的多鳍鱼目是圆鳞或硬鳞，但是在弓鳍鱼目明确指出了是硬鳞。普通动物学圆形硬鳞本质也是硬鳞。&lt;br /&gt;
话说什么时候这个网站才能恢复https访问，现在编辑起来好麻烦。&lt;br /&gt;
&lt;br /&gt;
==== 来自刘凌云《普通动物学》：P221上方表明十腕目左侧第5腕特化为茎化腕，而下方却说右侧。到底为哪一侧？ ====&lt;br /&gt;
任淑仙《无脊椎动物学》第二版p180:多数种类左侧（少数为右侧）第五腕，目前遇到的考试题大多表述为左侧第五腕，或许不严谨但一般也不算错&lt;br /&gt;
&lt;br /&gt;
随手补一点：&lt;br /&gt;
&lt;br /&gt;
十腕目：&lt;br /&gt;
&lt;br /&gt;
旋壳乌贼科：第五对腕均茎化&lt;br /&gt;
&lt;br /&gt;
乌贼科：左侧第五腕&lt;br /&gt;
&lt;br /&gt;
后耳乌贼科：左侧第五腕&lt;br /&gt;
&lt;br /&gt;
耳乌贼属：左侧第一腕&lt;br /&gt;
&lt;br /&gt;
僧头乌贼属：第一对腕均茎化&lt;br /&gt;
&lt;br /&gt;
微鳍乌贼科：第五对腕均茎化&lt;br /&gt;
&lt;br /&gt;
枪乌贼科：左侧第五腕茎化&lt;br /&gt;
&lt;br /&gt;
狭乌贼属：右侧第五腕茎化&lt;br /&gt;
&lt;br /&gt;
八腕目：&lt;br /&gt;
&lt;br /&gt;
十字蛸科：第一对腕均茎化&lt;br /&gt;
&lt;br /&gt;
单盘蛸科：右侧第三腕茎化&lt;br /&gt;
&lt;br /&gt;
章鱼科：右侧第三腕茎化&lt;br /&gt;
&lt;br /&gt;
船蛸科：左侧第三腕茎化&lt;br /&gt;
&lt;br /&gt;
以上只是列举几个例子，可见头足目茎化腕的情况，变化还是非常大的。不过整体而言，十腕左五八腕右三的规律是确切无疑的，普动可能是写错了。&lt;br /&gt;
&lt;br /&gt;
有些地方写第四对，是因为不把位于第四对的触腕看作腕，第五对茎化腕就成了第四对。&lt;br /&gt;
&lt;br /&gt;
以上信息来源十分古早，分类地位很可能改变，仅供娱乐，莫要上心。参考资料：张玺，齐钟彦，《贝类学纲要》，1961.&lt;br /&gt;
&lt;br /&gt;
==== 关于鸵鸟膀胱的类型：鸵鸟的膀胱是泄殖腔膀胱还是尿囊膀胱？ ====&lt;br /&gt;
不能想当然地认为是尿囊膀胱，鸵鸟的泄殖腔分为三个部分，粪道、泄殖道和肛道，粪道连接直肠，泄殖道有输尿管和生殖管开口，肛道开口于体外，背面有腔上囊；鸵鸟的泄殖道可以储存大量尿液，起到类似其他羊膜动物的膀胱的作用，因此严格来说鸵鸟也没有膀胱，不过书上还是普遍认为鸵鸟具有膀胱，那么就按来源属于泄殖腔膀胱。&lt;br /&gt;
&lt;br /&gt;
参考资料：[1] VERTEBRATES: COMPARATIVE ANATOMY, FUNCTION, EVOLUTION, EIGHTH EDITION， 2019&lt;br /&gt;
&lt;br /&gt;
[2]唐丽,彭克美,宋卉,位兰,王岩,李升和,杜安娜,靳二辉,王家乡.非洲雏鸵鸟泌尿系统的解剖学研究[J].野生动物,2006(05):35-37.&lt;br /&gt;
&lt;br /&gt;
==== 目前较为流行的动物学分类大致情况？（分蜕皮动物与冠轮动物的那一版） ====&lt;br /&gt;
[[文件:动物系统进化树.jpg|缩略图]]&lt;br /&gt;
→见右图&lt;br /&gt;
&lt;br /&gt;
（答主的图貌似有点老了，螺旋卵裂还全是未解决）&lt;br /&gt;
&lt;br /&gt;
现在螺旋卵裂分为有颚动物超门和扁虫冠轮动物两大支：&lt;br /&gt;
&lt;br /&gt;
①有颚动物超门包括颚口、微颚、轮虫、棘头四个原本在普动上写过的门（轮虫和棘头是一支，轮虫是个并系群，棘头成了轮虫下的一个目），毛颚动物目前可能要和有颚并到一支。&lt;br /&gt;
&lt;br /&gt;
②扁虫冠轮动物分出两支，一支归扁虫，一支归冠轮（像是废话），扁虫动物基部分支是中生动物（妹想到吧），之后的扁形动物和腹毛动物为姐妹群。&lt;br /&gt;
&lt;br /&gt;
③冠轮动物又进一步分为了两大支，一支是环节动物，有原本的多毛寡毛和蛭，还加上了星虫螠虫和西伯达虫，具体分的太乱，就不搞了，圆环动物门成了冠轮底下的未解决；&lt;br /&gt;
&lt;br /&gt;
④另一支分出软体动物和Kryptotrochozoa，翻译叫“氪金动物”（樂），包括触手冠动物（下分：腕足动物，含原腕足动物门和帚虫动物门；苔藓动物，含原内肛动物门及外肛动物门）和纽虫。&lt;br /&gt;
&lt;br /&gt;
——指正：Kryptotrochozoa应当翻译为“隐担轮动物”，希腊语kryptos代表隐藏的，Trochozoa代表担轮幼虫（trochophore larvae），即其幼虫是“隐藏的担轮幼虫”——发生改变但本质仍是担轮幼虫的辐轮幼虫(帚虫)、帽状幼虫(纽虫)、双壳幼虫(腕足)等等。&lt;br /&gt;
[[文件:目前基本公认的进化树.png|缩略图]]&lt;br /&gt;
（以上内容源自维基百科，其中一些分类群的定义尚有争议，但大致没错）&lt;br /&gt;
&lt;br /&gt;
==== 《无脊椎动物学》中写缠绕刺丝囊(spirocyst)仅珊瑚纲具有，但《普动》上写水螅具有卷缠刺丝囊(没写英文)，所以这两者是一个东西吗？如果不是，有什么区别？谢谢 ====&lt;br /&gt;
是一个东西，就是仅卷缠或分泌粘液，和穿刺刺丝囊区分&lt;br /&gt;
&lt;br /&gt;
==== 哪些无脊椎动物的血红（或血蓝之类）蛋白在血浆中，哪些又在血细胞中？ ====&lt;br /&gt;
非常值得总结的内容！敬请期待：[[有关呼吸色素的总结]]&lt;br /&gt;
&lt;br /&gt;
==== 青蛙如何分辨用于求偶的高频声音和用于警告的低频声音，它的听觉器官只为一个听斑，与行波理论不符？ ====&lt;br /&gt;
[[文件:Answer.png|左|缩略图|我就说翻译些外文教材有用]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
链接：[[第十七章 感觉器官]]&lt;br /&gt;
&lt;br /&gt;
==== 对报警外激素反应最强烈的工蜂年龄 ====&lt;br /&gt;
响应报警外激素的工蜂，接下来很可能在应对外敌的战斗中牺牲，所以垂垂老矣的老年工蜂会积极反应，而年少的工蜂还“大有可为”，不值得牺牲，响应就弱。&lt;br /&gt;
&lt;br /&gt;
==== 关于鱼类鳔体积调节与悬浮水层高度的问题：《比解》上明确写了当鱼稳定在深水层时，鳔内气体需要减少，而稳定在浅水层时需增加鳔内气体但是深水层中水压较大，压缩鱼体体积，减小浮力，鱼想要稳定在该水层中应当增加浮力才对，为何排气而非增加气体？ ====&lt;br /&gt;
你推理的是正确的，书上写错了。&lt;br /&gt;
&lt;br /&gt;
==== 什么是初生颌关节？和初生颌有什么关联？ ====&lt;br /&gt;
初生颌关节指方骨与关节骨之间（或腭方与麦氏之间）的，上下颌之间的关节。与之相对应的是哺乳类的齿骨与鳞骨之间形成的次生颌关节。&lt;br /&gt;
&lt;br /&gt;
而初生颌是指软骨鱼和某些基部硬骨鱼那样的麦氏软骨与腭方软骨起主要功能的颌，与之相对的是上下颌功能被加入的膜原骨替代的次生颌，起功能的骨头有前颌骨、上颌骨、齿骨、隅骨。&lt;br /&gt;
&lt;br /&gt;
=== 生物化学 ===&lt;br /&gt;
&lt;br /&gt;
==== dna与rna谁的密度大： ====&lt;br /&gt;
RNA的密度最大。&lt;br /&gt;
&lt;br /&gt;
DNA、RNA和蛋白质这三种生物大分子都具有一定的密度，其中&#039;&#039;&#039;RNA的密度最大&#039;&#039;&#039;，蛋白质的密度最低，DNA的密度介于两者之间的某一个位置。 一个特定的DNA分子的密度主要取决于它的GC含量和构象状态。 GC含量越高，密度越大。 与超螺旋结构存在的DNA密度显然要高于松弛状的DNA。 而变性的DNA密度要高于没有变性的DNA。&lt;br /&gt;
&lt;br /&gt;
附：“不同大分子的浮力密度也不同。DNA一般在1.7以上，RNA为1.6，蛋白质为1.35-1.40”此应为王镜岩第三版的错误，其第四版与比较新的教材已更正&lt;br /&gt;
&lt;br /&gt;
==== 多不饱和脂肪酸的氧化过程？ ====&lt;br /&gt;
有点意思哈~右边请！[[多不饱和脂肪酸的氧化]]&lt;br /&gt;
&lt;br /&gt;
==== 酶活力单位的定义是否有问题？ ====&lt;br /&gt;
误解主要从“所需”两字产生，删掉就好理解了。实际上就是一个速率，底物转化质量比时间m/t，只不过把这个速率用来表示酶量。比如1min这些酶（不管多少酶不管什么酶）转化了1μmol底物，那这些酶的量就是1U。相应的，如果1min这些酶转化了2μmol底物，那这些酶的量就是2U。实际上和底物相关，但是用于表示酶量。所以此“所需”非彼“所需”。在1min内转化1μmol底物需要1U酶，在1min内转化2μmol底物需要2U酶，没什么问题。至于提到的国内按什么来，国内外都是统一的，是国际酶学会订的（虽然现在酶学会更推荐用kat这个单位），做过实验动手算过就明白了。&lt;br /&gt;
&lt;br /&gt;
==== from徐长法《生物化学》下册p90，真的有无脊椎动物体内存在乙醛酸循环吗？ ====&lt;br /&gt;
解答：有。乙醛酸循环是植物和某些微生物（大肠杆菌、醋酸杆菌等）及一些无脊椎动物细胞内脂肪酸氧化分解为乙酰CoA之后，在乙醛酸循环体(glyoxysome)内生成琥珀酸、乙醛酸和苹果酸的过程。参见[https://baike.baidu.com/item/%E4%B9%99%E9%86%9B%E9%85%B8%E5%BE%AA%E7%8E%AF/619160 百度百科]（百度百科内容不一定正确，请辩证对待）&lt;br /&gt;
除了具有双功能融合 ICL-MS 基因的线虫，其他后生动物无。[https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1630690 后生动物乙醛酸循环酶的进化]&lt;br /&gt;
&lt;br /&gt;
==== 求一个关于金属酶/金属蛋白的整理。比如质膜ATP酶以Na为辅酶，精氨酸酶以Mn作为辅酶等等 ====&lt;br /&gt;
解答：先写了一点点。可以参考[https://zh.wikipedia.org/zh-hans/金属蛋白 金属蛋白]&lt;br /&gt;
&lt;br /&gt;
==== 所以反竞争性抑制剂有啥应用实例 ====&lt;br /&gt;
现实中几乎没有反竞争性抑制剂（见杨荣武生物化学原理），反竞争性抑制剂仅存在理论研究价值。&lt;br /&gt;
杨sir这里写的大概的确有问题：多见于多底物发生的生化反应中，在单一底物的酶促反应中不常见，例如L-同型精氨酸和L-苯丙氨酸等多种L-氨基酸是碱性磷酸酶的反竞争性抑制剂，它们能结合碱性磷酸酶与底物的复合物，并阻碍反应继续进行；此外，肼类化合物反竞争性抑制胃蛋白酶的活性，氰化物也是芳香硫酸酯酶的反竞争性抑制剂。&lt;br /&gt;
参考&lt;br /&gt;
SPECTOR T, HAJIAN G．Statistical methods to distinguish competitive, noncompetitive, and uncompetitive enzyme inhibitors．Analytical biochemistry，1981，115(2)：403-409．DODGSON K S, SPENCER B, WILLIAMS K．Examples of Anti-competitive Inhibition．Nature，1956，177(4505)：432-433．&lt;br /&gt;
《中国大百科全书》第三版网络版&lt;br /&gt;
&lt;br /&gt;
==== 为何盐析使用硫酸铵而非氯化钠氯化钾等？ ====&lt;br /&gt;
早期生物学家在做实验的时候发现有盐析现象，于是去找适合盐析的盐。找到最后觉得硫酸铵最好。当然不一定用硫酸铵，这个都取决于个人。毕竟盐析推荐用中性盐但是硫酸铵明显是个酸性盐但照样用。当然可以用氯化钠什么的但是效果不一定好（在家里可以把食盐撒到鸡蛋清上能看到有白色絮状沉淀）。这取决于盐的性质和待处理蛋白质的性质，有很大的多样性。&lt;br /&gt;
&lt;br /&gt;
补：今天遇到了段志贵教授，他告诉我另外一个点：硫酸铵溶解度非常大。&lt;br /&gt;
&lt;br /&gt;
话说这个问题背后的知识点还是比较复杂的。我讲两句。（咳）&lt;br /&gt;
&lt;br /&gt;
电荷密度高的离子，结合水分子的能力强，被称为“亲液的”Kosmotropic。&lt;br /&gt;
&lt;br /&gt;
电荷密度低的离子，就被称为“离液的”Chaotropic 。&lt;br /&gt;
&lt;br /&gt;
像磷酸根，硫酸根这样的多价离子，电荷多，电荷密度高，就是亲液剂；像碘离子、硫氰酸根离子，不光电荷少，分子还大，电荷密度低，就是离液剂。&lt;br /&gt;
&lt;br /&gt;
从亲液性强的排列到离液性强的离子，就成了Hofmeister序列。&lt;br /&gt;
&lt;br /&gt;
至少看起来，阳离子离液剂+阴离子亲液剂=盐析+不变性（SO&amp;lt;sub&amp;gt;4&amp;lt;/sub&amp;gt;&amp;lt;sup&amp;gt;2-&amp;lt;/sup&amp;gt;+NH&amp;lt;sub&amp;gt;4&amp;lt;/sub&amp;gt;&amp;lt;sup&amp;gt;+&amp;lt;/sup&amp;gt;），阴离子离液剂+阳离子亲液剂（SCN&amp;lt;sup&amp;gt;-&amp;lt;/sup&amp;gt;+胍）=盐溶+变性。&lt;br /&gt;
[[文件:Hofmeister serie.png|缩略图]]&lt;br /&gt;
这解释了为什么盐析用硫酸铵，而变性用异硫氰酸胍。显然这里面也有着成本、溶解性、避免形成难溶的沉淀物之类的考量。&lt;br /&gt;
&lt;br /&gt;
至于为什么，我的理解如下：蛋白质多为阴离子：&lt;br /&gt;
&lt;br /&gt;
* 如果阳离子为离液剂，此阳离子不愿结合水，反而会结合蛋白质：&lt;br /&gt;
** 蛋白质分子结合了相同的离子，相互排斥，不易沉淀，造成盐溶&lt;br /&gt;
** 结合了在蛋白质上的离子破坏了蛋白质的氢键，造成变性&lt;br /&gt;
* 如果阳离子是亲液剂，此阳离子希望结合水，便不管蛋白质：&lt;br /&gt;
** 水分子都被亲液剂结合，蛋白质缺水沉淀，造成盐析&lt;br /&gt;
** 蛋白质不会受到离子的影响，不会变性&lt;br /&gt;
* 如果阴阳离子都是亲液剂，阴阳离子互相结合而不结合水，减小总体亲液效果。&lt;br /&gt;
* 如果阴阳离子都是离液剂，阴阳离子不互相结合反而都去结合水，减小总体离液效果。&lt;br /&gt;
&lt;br /&gt;
以上是我个人的理解，不一定对，但肯定能够帮你记住这些规律😋&lt;br /&gt;
&lt;br /&gt;
==== b族维生素的组成明析 / vb8是肌醇还是腺嘌呤核苷酸  或者“生物素”（科普中国说的，笑） ====&lt;br /&gt;
[[文件:B族维生素.png|缩略图|B族维生素解析]]&lt;br /&gt;
见右侧图“B族维生素解析”&lt;br /&gt;
&lt;br /&gt;
注：此图为朱斌《生物竞赛专题精炼》P100，题主可自己看。另外这些都有争议，朱斌这里只是观点之一。&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;沙林毒气的作用机理？（之前有看到说它是乙酰胆碱酯酶的自杀型抑制剂，但没有找到别的资料）&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
杨rw《生物化学原理》第三版p170  沙林即甲基氟磷酸异丙酯，是一种有机磷化物，可以共价修饰酶活性中心的丝氨酸残基的羟基使得其失活。沙林属于基团特异性抑制剂&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;Yang Sir的书上说“嘌呤环的嘧啶环和咪唑环之间有小的弯曲，故嘌呤环不完全在一个平面上”，但是根据本人浅薄的化学知识，C5和C4应当都是sp2杂化，为什么会出现弯曲呢（话说这是不是已经不是生物的范畴了）&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
环张力与键角矛盾 六元环的理想键角为120°，而五元环的理想键角约为108°。当两个环在C4和C5处稠合时，连接处的键角需要兼顾两种环的需求，导致局部键角偏离理想值（如压缩或拉伸），从而引发整体结构的扭曲。&lt;br /&gt;
共轭受限与定域化效应  尽管sp²杂化原子通常通过π共轭保持平面性，但在嘌呤中，五元环与六元环的共轭体系可能不完全连续。咪唑环的部分双键定域化（如C4-C5键的单双键特性交替），削弱了共轭的连续性，允许一定程度的弯曲。&lt;br /&gt;
孤对电子排斥与杂原子影响  嘧啶和咪唑环中的氮原子孤对电子占据不同杂化轨道（如嘧啶环的N1、N3为sp²杂化，咪唑环的N7、N9可能参与不同键合）。这些孤对电子的空间排斥可能进一步破坏平面性。&lt;br /&gt;
实验证据支持  X射线晶体学数据显示，嘌呤分子中嘧啶环与咪唑环之间存在约5°~10°的轻微弯曲（如咖啡因等衍生物），证实了结构的非完全平面性。这种弯曲在溶液中因分子振动可能更加显著。&lt;br /&gt;
&lt;br /&gt;
==== 根据周德庆《微生物学教程》，磺胺类药物抑制二氢蝶酸合成酶，但貌似一直说的是二氢叶酸合成酶，是一直说的都是错的吗？ ====&lt;br /&gt;
是的，确实是抑制二氢蝶酸合成酶。此内容也得到《微生物生物学》（霍乃蕊，余知和）的支持。&lt;br /&gt;
&lt;br /&gt;
=== 分子生物学 ===&lt;br /&gt;
&lt;br /&gt;
==== 想求证一下，“DNA复制执照因子假说”中“执照”因子主要成分是Mcm蛋白，这是否是那种DNA解旋酶？毕竟好像在信号通路那里曾出现过一个不是后期促进复合物的APC。 ====&lt;br /&gt;
解答：单说Mcm应该是同一个家族。真核生物DNA复制所用到的Mcm2-10同时负责调控复制启动，Mcm不结合DNA也不会开始复制。关于Mcm是否是执照因子的讨论见下：&lt;br /&gt;
&lt;br /&gt;
一个异议：杨荣武《生物化学原理》3rd中，执照因子应是Cdt10和Cdc6，这两者在之后的复制过程被回收或降解。在丁明孝.等《细胞生物学》5th中，细胞周期一章的图中，有对Cdt10和Cdc6的标注，并且和杨荣武书上的过程一致，因此，如果杨荣武改题，这个知识点可能会出现极大争议。&lt;br /&gt;
&lt;br /&gt;
↑杨荣武分子生物学第二版说执照因子是Cdt1和Cdc6，至于是否包括Mcm，杨sir没有正面回答这个问题，仅说明这两种蛋白会首先结合Mcm。不过按照pre-RC的定义，应该不包括Mcm。联赛假如出了建议按杨sir来，因为他可以改题。&lt;br /&gt;
&lt;br /&gt;
==== 来自杨荣武《分子生物学》:DNAP4被用作修复，且在正常生长时被诱导合成，那么为何它“易错”？ ====&lt;br /&gt;
DNAPIV合成效率不高，本来就是修复用的。易错可以引入更多突变，提高细胞生存率，并且参与SOS途径。SOS的时候细胞都快死了，哪还会在乎这点错误。&lt;br /&gt;
&lt;br /&gt;
==== 杨sir的分生第二版P216图6-6“RecBCD酶在同源重组中的作用”中，文字是“5&#039;-外切酶”但图看起来是核酸内切酶，请问应如何理解；以及杨sir在学堂在线上讲的分生课程讲的是RecBCD先同时发挥3&#039;-外切酶与5&#039;-外切酶活性，遇到χ序列后解链酶活性被激活，但他的《分子生物学（第二版）》讲的先发挥解链酶与3&#039;-外切酶活性，遇到χ序列后再发挥“5&#039;-外切酶（？）”活性，请问应参考哪种说法？ ====&lt;br /&gt;
集训时问了杨荣武，他说按学堂在线上说的来（即“RecBCD先同时发挥3&#039;-外切酶与5&#039;-外切酶活性，遇到χ序列后解链酶活性被激活”）。&amp;lt;small&amp;gt;同时杨sir透露他的分生要开始编新版（&amp;lt;/small&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==== RecBCD是否具有5’外切酶活性，各大教材措辞不同。 ====&lt;br /&gt;
杨sir本人说有（见上一条）&lt;br /&gt;
&lt;br /&gt;
=== 细胞生物学 ===&lt;br /&gt;
&lt;br /&gt;
==== from 徐长法《生物化学》下册p153，“不同蛋白O-糖基化的起始起点并不一致，有的在内质网，有的在内质网-高尔基体中间结构，也有的在内侧高尔基体”，这句话准确吗？也就是说不是像翟中和《细胞生物学》那样只在高尔基体进行吗？ ====&lt;br /&gt;
解答：这似乎是一个&amp;quot;有争议&amp;quot;的问题。观点一：①如题，但徐长法我没有看过不做评价（我看的是杨sir和王镜岩QwQ，大佬有看过的可以验证一下）。②有[https://zhuanlan.zhihu.com/p/213786542 这篇知乎文章]描述O-linked为大多发生在内质网，黏蛋白发生在高尔基体（这篇文章给出了参考文献，可以自行验证）。观点二：①翟中和描述的是N-linked在内质网和高尔基体发生，O-linked在高尔基体发生（但是他没有给出肯定的判断）。②杨sir分子生物学第二版P393说O-linked只发生在高尔基体，一个很直接的结论。个人认为应该只在高尔基体，因为相关的糖基转移酶分布在高尔基体上。（而且杨sir能改题，直接信杨sir啊）至于其它观点不知从何而来。至少我目前做过的题都是按照高尔基体来的。&lt;br /&gt;
&lt;br /&gt;
补充一下答主的回答：其实O-linked在胞质也可进行（非典型O-linked，由N-GlcNAc连接至Ser上而成，这在丁明孝.等《细胞生物学》5th中有进行描述），而且不典型的/非翟中和的O-linked有很多形式，按糖的种类分可以包括O-GalNAc、O-GlcNAc、O-Gal、O-Man、O-Fuc、O-Glc，后三种在维基百科中提到了，而且这三种是在内质网进行的（O-Man是在内质网起始，在高尔基体完成），因此，说在内质网应该是OK的。&lt;br /&gt;
&lt;br /&gt;
另外，朱斌还在他的书里写过Tyr的“O-linked”，杨荣武也曾在讲课的时候提到蛋白聚糖的“O-linked”，总之说法很多，有很多可拓展之处。（我把维基百科扒下来了，PDF自取：[[:文件:O-linked glycosylation.pdf|O-linked glycosylation---Wikipedia]]）&lt;br /&gt;
&lt;br /&gt;
==== P62提到ABC超家族用于转运分子，而P66又说CFTR属于ABC超家族，是否矛盾？ ====&lt;br /&gt;
解答：应该是翟中和的问题，他想说的小分子是小物质的意思，不是分子的意思。离子也可以。ABC超家族是很大一类蛋白，基本上什么类型的物质都能转运。（似乎CFTR在效果上是是一个需要用ATP开启的离子通道蛋白，结构上属ATP超家族）&lt;br /&gt;
&lt;br /&gt;
追问：ATP超家族又是啥ʕ•̫͡•ʔ&lt;br /&gt;
&lt;br /&gt;
解答：就是ABC超家族，ATP binding cassette superfamily.&lt;br /&gt;
&lt;br /&gt;
==== 癌细胞体外培养是否贴壁？ ====&lt;br /&gt;
不贴壁、无接触抑制（后者为前者原因，二者同为癌细胞区别于正常细胞的现象）&lt;br /&gt;
&lt;br /&gt;
这话说的，意思是癌细胞可以被悬浮培养吗？大概不能。一般的癌细胞最开始也是贴壁长成一层，只不过长满一层后不会接触抑制，会继续长成好几层。&lt;br /&gt;
&lt;br /&gt;
==== 鞘脂的合成部位（sER or Golgi&#039;&#039;&#039;）&#039;&#039;&#039; ====&lt;br /&gt;
详见[https://www.dxy.cn/bbs/newweb/pc/post/44006920 鞘脂]&lt;br /&gt;
&lt;br /&gt;
——神经酰胺在sER上合成，再转到高尔基体上合成鞘脂。&lt;br /&gt;
&lt;br /&gt;
==== 想问一下，真核生物的核糖体还有E位点吗？ ====&lt;br /&gt;
解答：有E位点。详见视频：https://www.bilibili.com/video/BV19w4m127QK/?spm_id_from=333.337.search-card.all.click&amp;amp;vd_source=86f4f9d6f47b1620e6f209f2a952173f&lt;br /&gt;
&lt;br /&gt;
==== 来自丁明孝.等《细胞生物学》5th：为何此书上写CFTR突变体是&amp;quot;gain of function&amp;quot;? ====&lt;br /&gt;
解答:个人见解,应为编辑错误，翟好像并未严格区分逗号与分号大小问题，分号中间的逗号改为句号即可理解&lt;br /&gt;
&lt;br /&gt;
====联会复合体的装配起始在什么时候？====&lt;br /&gt;
&lt;br /&gt;
偶线期，经过粗线期，在双线期解体&lt;br /&gt;
&lt;br /&gt;
====观察样品中酶活及其分布用何种包埋？====&lt;br /&gt;
&lt;br /&gt;
答：根据王金发编写的《细胞生物学实验指南》大概是冷冻包埋，但是我手边没这本书，等等我。&lt;br /&gt;
&lt;br /&gt;
==== 间体（中膜体，拟线粒体）存在于活细胞中吗，还是只是死细胞中人为造成的结构。关于这个问题有好多说法，找不到最新的文献解释 ====&lt;br /&gt;
人为造成，但重复性良好所以被误解很多年。详情请看The Very Reproducible (But Illusory) Mesosome&lt;br /&gt;
&lt;br /&gt;
=== 生理学 ===&lt;br /&gt;
&lt;br /&gt;
==== 关于不同离子转运蛋白耗能多少及转运离子数量的总结？ ====&lt;br /&gt;
刚刚写了一点点，还有好多好多内容需要补充→&#039;&#039;&#039;[[载体蛋白和通道蛋白]]&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==== 朱大年《生理学》第九版P295表格中提到本体感觉属于Aα型神经纤维，但是P325却提到肌梭的传入神经包括Ia和II类纤维，其中花枝末梢是II类纤维的末梢且负责本体感觉。已知II类纤维属于Aβ类纤维，前后是否矛盾？John G. Nicholls等《神经生物学》第五版也有肌梭Ia型和II型纤维分别是“动态”和“静态”的传入纤维，是否可类比“肌梭长度感觉”和“本体感觉”？那朱P295表格是否表述不妥？ ====&lt;br /&gt;
解答：ABC和 I II III IV是分别两个分类系统，其中ABC多用于传出纤维的分类，I II III IV 多用于传入纤维的分类（不绝对，多用于而已）这个地方就是Aα为支配梭外肌传出纤维、初级肌梭传入纤维（本体感觉）。题主所表述的II类纤维属于Aβ的表述是不妥的，因为根本不是一个分类系统。Aβ多为皮肤触压觉传入纤维。分类标准的话ABC主要按照传导速度，I II III IV主要按照纤维直径。关于分类[https://zhuanlan.zhihu.com/p/68321428 可见这里]，当然这些内容朱大年也写过。&lt;br /&gt;
&lt;br /&gt;
追问《生理学》关于肌梭的传入纤维：抽象的是朱大年的表格上把两种分类系统对比了一下说Aα对应Ia和Ib，Aβ对应II……&lt;br /&gt;
&lt;br /&gt;
解答：在肌紧张里面α运动神经纤维不就是Aα吗。首先注意朱大年是这么写的“I II III IV类纤维分别相当于Aα Aβ Aδ C类&#039;&#039;&#039;后根纤维&#039;&#039;&#039;，但又&#039;&#039;&#039;不完全等同&#039;&#039;&#039;”，所以先不要把两种分类混一起。Aα负责肌肉本体感觉应该是没有争议的。II类纤维朱大年只表述了“可能有关”。其实Ia类神经纤维也负责肌肉本体感觉。&lt;br /&gt;
&lt;br /&gt;
==== 哺乳动物成熟红细胞裂解后,正常小泡和外翻性小泡的形成过程 ====&lt;br /&gt;
解答：红细胞受低渗影响破裂形成血影（残留的膜骨架＋膜），膜重新闭合时可能形成正常小泡或外翻性小泡&lt;br /&gt;
&lt;br /&gt;
==== 关于血液湍流的发生以及此时的血液黏度和血流切率，个人感觉朱大年生理学P116-117上的说法有些矛盾（下列一二）====&lt;br /&gt;
# 在血液黏度低的时候容易形成湍流 &lt;br /&gt;
# 血流切率越高，层流现象越明显，即血流黏度较低；相反当血流切率较低的时候，血液黏度高&lt;br /&gt;
想问一下湍流发生的时候，血液黏度究竟是高是低？血流切率又是怎样的呢？谢谢！&lt;br /&gt;
朱大年教材中的两个表述并不矛盾，而是从不同角度描述：&lt;br /&gt;
黏度低易湍流：强调黏度对Re的直接影响（普遍规律）。&lt;br /&gt;
高切率→低黏度→层流明显：指在未达临界Re时，高切率下剪切稀化使层流更稳定；但若Re超过临界值（如高流速），仍会发展为湍流。&lt;br /&gt;
&lt;br /&gt;
==== 肾素和抗利尿激素的作用都是减少尿量，从而使循环血量增多即升高血压，但为什么抗利尿激素抑制肾素的分泌呢？ ====&lt;br /&gt;
类似负反馈，因为AngII促进ADH分泌&lt;br /&gt;
&lt;br /&gt;
=== 植物生理学 ===&lt;br /&gt;
&lt;br /&gt;
==== 为什么植物细胞将质子泵出去，再让钾离子进来这一过程对细胞水势下降有贡献？理论上来说不是相同数量的钾离子进来后就进不来了吗？ ====&lt;br /&gt;
追问《植物生理学》水势：我的意思是，假如泵出去10个质子，不是只会进来10个钾离子就结束了吗？和氯离子没有关系吧？&lt;br /&gt;
&lt;br /&gt;
解答：在气孔打开时，H+-atp酶会将质子泵出去，氯离子会伴随着钾离子的大量吸收而吸收，于是会导致细胞水势下降。（可见王小菁第八版P25）&lt;br /&gt;
&lt;br /&gt;
↑补充答主回答：质子对水势贡献不大，更多的是通过电荷把钾离子带进来。钾离子和蔗糖是对细胞水势有更大贡献的（见Taiz 5th）。因此相同电荷的质子出去，电荷的钾离子进来，电荷守恒的同时降低了细胞内的水势。答主所说的氯离子我暂时没有找到出处，暂留异议。&lt;br /&gt;
&lt;br /&gt;
另：据苗健老师：玉米黄素并不是介导气孔开放的蓝光受体，应该是向光素介导的磷酸化途径。Taiz 7th已经删除了关于玉米黄素对气孔影响的文字，改成了向光素。但是因为国内教材都是抄的5th与6th所以都写的有玉米黄素。算是对水势的一个补充吧。这里有Taiz 7th的电子书（英文原版，&#039;&#039;&#039;856MB&#039;&#039;&#039;较大，建议开启浏览器自带多线程下载（不会自行百度）或使用IDM进行下载）：[https://cpucd.cpuikuns.top/s/GOia 分享-Plants Physi...]&lt;br /&gt;
&lt;br /&gt;
追问植物生理学那个问题：“在标准压力下，溶液的渗透势等于溶液的水势，因为溶液的压力势为0MPa。溶液的的渗透势决定于溶液中溶质颗粒（分子或离子）总数。”&lt;br /&gt;
钾离子贡献更大，是因为质子可能与有机酸等结合，相对来说颗粒总数更少吗？&lt;br /&gt;
&lt;br /&gt;
↑（个人见解，如有错误请佬指出）质子在此处的作用可以分为两部分：1）通过膜内外电位的改变使得钾离子通道开放，钾离子内流；2）质子-氯离子同向转运（见Taiz 5th，顺便解决了上一个补充回答的异议）。若是单纯质子的产生而不泵出显然无法做到这两点。所以，钾离子、质子、氯离子三者便均参与了水势的降低。另外，根据戈德曼方程可知虽然钾离子的浓度是胞内大于胞外，但电势是胞外大于胞内的。&lt;br /&gt;
&lt;br /&gt;
==== 请问有没有关于植物激素互作（比如乙烯调控IAA和JA及其下游基因）的总结，谢谢 ====&lt;br /&gt;
比较简要的总结，内容大部分来自王小菁《植物生理学（第8版）》，小部分来自网络等：&lt;br /&gt;
&lt;br /&gt;
===== 协同作用： =====&lt;br /&gt;
生长素&amp;amp;赤霉素-促进果实生长&lt;br /&gt;
&lt;br /&gt;
细胞分裂素&amp;amp;多胺-形成层分化&lt;br /&gt;
&lt;br /&gt;
独角金内酯&amp;amp;细胞分裂素-侧根生长&lt;br /&gt;
&lt;br /&gt;
独角金内酯&amp;amp;油菜素甾醇-侧根生长&lt;br /&gt;
&lt;br /&gt;
系统素（多肽激素）&amp;amp;茉莉素-抑制蛋白酶（在植物受病虫害时抑制植物蛋白的降解，保护尚未受伤的组织）&lt;br /&gt;
&lt;br /&gt;
乙烯&amp;amp;茉莉素-诱导抗病基因表达&lt;br /&gt;
&lt;br /&gt;
===== 促进作用： =====&lt;br /&gt;
生长素→乙烯产生&lt;br /&gt;
&lt;br /&gt;
脱落酸→果实产生乙烯&lt;br /&gt;
&lt;br /&gt;
茉莉素→乙烯合成&lt;br /&gt;
&lt;br /&gt;
===== 拮抗作用： =====&lt;br /&gt;
赤霉素&amp;amp;脱落酸-平衡种子发芽&lt;br /&gt;
&lt;br /&gt;
独角金内酯&amp;amp;脱落酸-侧芽生长&lt;br /&gt;
&lt;br /&gt;
多胺&amp;amp;乙烯-竞争前体（SAM）&lt;br /&gt;
&lt;br /&gt;
植物生长促进剂（生长素、赤霉素、细胞分裂素、乙烯）&amp;amp;植物生长抑制剂（脱落酸、水杨酸、茉莉素）-逆转促进/抑制作用&lt;br /&gt;
&lt;br /&gt;
===== 抑制作用： =====&lt;br /&gt;
细胞分裂素→生长素-抑制顶端优势&lt;br /&gt;
&lt;br /&gt;
乙烯→生长素-抑制转运&lt;br /&gt;
&lt;br /&gt;
脱落酸→生长素-抑制运输&lt;br /&gt;
&lt;br /&gt;
水杨酸→乙烯-抑制ACC转变为乙烯&lt;br /&gt;
&lt;br /&gt;
茉莉酸→乙烯对黄化苗顶端弯勾形成的促进作用&lt;br /&gt;
&lt;br /&gt;
乙烯→茉莉酸介导的植物伤害防御反应（通过加强茉莉酸代谢）&lt;br /&gt;
&lt;br /&gt;
=== 进化生物学 ===&lt;br /&gt;
&lt;br /&gt;
==== fay and wu 的H 较tajima的d的优点？ ====&lt;br /&gt;
鉴于这两个我一个都不会算，于是去查维基百科，得到的结果如下：&lt;br /&gt;
&lt;br /&gt;
①两者都是借由计算差异位点（分离位点S）数目和采样对之间核苷酸差异的数量（这些称为成对差异）这些数据计算群体遗传参数θ后统计得出的统计量，前面的计算过程基本一致，只是最后的统计量采用了不同表示方法；&lt;br /&gt;
&lt;br /&gt;
②相较于D，H的优点在于，当群体内含有过多罕见多态性时，H能够在D的基础上给出在此情况下进化的方式（例如选择性清除等等），而不是仅仅给出非随机进化的结论，这个优势是基于H参考了外群数据，因此纳入了祖先性状，若与祖先性状一致则该位点可能是经历了负选择等等&lt;br /&gt;
&lt;br /&gt;
（当然这都是维基百科说的，[[:文件:Genetics1405.pdf|原文]]里面没看懂哪有外群，不过确实是区别了选择性清除和其他因素，至于计算这块儿我就爱莫能助了）&lt;br /&gt;
&lt;br /&gt;
=== 遗传学 ===&lt;br /&gt;
&lt;br /&gt;
==== 求优势对数计分法中Lod值与连锁情况的对应关系 ====&lt;br /&gt;
Lod&amp;gt;3存在显著的连锁关系，Lod&amp;gt;1存在连锁，Lod&amp;lt;-2无连锁（参见戴灼华3th ed，标准意义上这不是生信问题qwq）&lt;br /&gt;
[[文件:半不育.png|缩略图]]&lt;br /&gt;
&lt;br /&gt;
==== 有关平衡易位杂合体“半不育”的疑问：理论上来说平衡易位杂合体可产生六种配子，其中仅两种是相间分离产生，即1/3配子可育而2/3配子不育。书上的叙述是利用50%配子不育的现象提出了易位，说明半不育是实验观察到的结果，是否有合理的解释为何1/3的可育配子在实际情况下变为50%可育？(来自重庆某高一生竞生） ====&lt;br /&gt;
如右图所示，平衡易位杂合体确实存在3种分离方式，但其发生概率并不相同；对于导致可育配子的相间分离和导致不育配子的相邻分离-1而言，其同源着丝粒相互分开，慨率较大且相等；对于导致不育的相邻分离-2而言，其同源着丝粒之间不分开，比较罕见。&lt;br /&gt;
&lt;br /&gt;
因此大体上看，主要会注意到相间分离和相邻分离-1，看起来确实接近一半的配子不育。&lt;br /&gt;
&lt;br /&gt;
==== 单倍体和一倍体明显的差异是什么呢？ ====&lt;br /&gt;
一倍和单倍这两个术语之间的区别微妙： 一倍染色体组是在多倍体系列的物种(如菊属)中成倍增加的基本染色体组。 单倍染色体组是存在于配子中的染色体集合，不管该物种的染色体数目是多少。 因为在二倍体生物中，一倍染色体组和单倍染色体组是一样的，所以可能出现混淆。想一 想四倍体，有助于弄清这一区别：四倍体含四个一倍染色体组，因而单倍体配子是二倍体。&lt;br /&gt;
&lt;br /&gt;
=== 生物技术 ===&lt;br /&gt;
&lt;br /&gt;
==== 如何制备emsa所用核酸探针？ ====&lt;br /&gt;
解答：要做EMSA首先要有参考基因组，然后化学合成/不对称PCR即可？&lt;br /&gt;
&lt;br /&gt;
=== 生态学 ===&lt;br /&gt;
&lt;br /&gt;
==== 生态学中用相邻个体最小距离检验分布型时，D=1/ (2N^{1/2})公式的推导过程？ ====&lt;br /&gt;
[[文件:屏幕截图 2024-11-14 190159.png|缩略图]]&lt;br /&gt;
（或许公式可以重新改一下下？有点不太明白）&lt;br /&gt;
&lt;br /&gt;
解答：&lt;br /&gt;
&lt;br /&gt;
在泊松分布中，有零个个体分布在指定的半径为r的区域内的概率P(零)=exp{-λπr²}&lt;br /&gt;
&lt;br /&gt;
因此，P(R≤r)=1-exp{-λπr²}&lt;br /&gt;
&lt;br /&gt;
其概率密度函数f(r)=2λπrexp{-λπr²} （根据P(x＜a)=∫(0→a)(f(x)) dx）&lt;br /&gt;
&lt;br /&gt;
所以距离的期望E(r)=∫(0→∞)r×f(r) dr=∫(0→∞)2λπr²exp{-λπr²} dr=1/(2λ^{1/2}).&lt;br /&gt;
&lt;br /&gt;
(该积分换元后使用Γ函数计算)（λ在这里表示分布密度，即图中的N）&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
	<entry>
		<id>https://osm.bio/index.php?title=%E7%AC%91%E8%AF%9D%E6%95%B0%E5%88%99&amp;diff=4286</id>
		<title>笑话数则</title>
		<link rel="alternate" type="text/html" href="https://osm.bio/index.php?title=%E7%AC%91%E8%AF%9D%E6%95%B0%E5%88%99&amp;diff=4286"/>
		<updated>2025-03-06T01:05:51Z</updated>

		<summary type="html">&lt;p&gt;Shiningstars：​&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;=== 杨海明和马伟元有明显的生态位分化 ===&lt;br /&gt;
杨海明只用黑板下半部，马伟元只用黑板上半部。&lt;br /&gt;
&lt;br /&gt;
=== 请问人有几个规管？ ===&lt;br /&gt;
三个半。&lt;br /&gt;
&lt;br /&gt;
=== 方孝孺被朱棣满门抄斩 ===&lt;br /&gt;
自此脊索动物门全部灭绝。&lt;br /&gt;
&lt;br /&gt;
=== 在两栖类中胸骨发达的肋骨不发达，肋骨发达的胸骨不发达，故两栖无胸廓 ===&lt;br /&gt;
青蛙王子被公主亲吻后化为人身，第一句话便是：“感谢你让我长出胸廓！”&lt;br /&gt;
&lt;br /&gt;
=== 生物学按照界门纲目科属种的方式来分类 ===&lt;br /&gt;
因此科比纲门小。&lt;br /&gt;
&lt;br /&gt;
=== 哪一种蜜蜂不能飞？ ===&lt;br /&gt;
科比（kobe）&lt;br /&gt;
&lt;br /&gt;
蜜蜂英文bee，一个无聊的谐音梗&lt;br /&gt;
&lt;br /&gt;
=== 哪一种蜜蜂杀人数量最多？ ===&lt;br /&gt;
无人机。&lt;br /&gt;
&lt;br /&gt;
笑点解析：“无人机”和“雄蜂”的英文都是drone，雄蜂是一种蜜蜂，而无人机被广泛运用于现代战争中，造成了大量的人员伤亡。&lt;br /&gt;
&lt;br /&gt;
=== 反式脂肪酸 ===&lt;br /&gt;
笑点解析：左图是一种顺式脂肪酸（&#039;&#039;cis&#039;&#039; fat），而右图是“&#039;&#039;trans&#039;&#039; fat”，可理解为反式脂肪酸，也可理解为“trans（跨性别者）”的“fat（胖子）”，生物化学与政治正确的碰撞，令人忍俊不禁。[[文件:反式脂肪酸.png|缩略图]]&lt;br /&gt;
&lt;br /&gt;
=== 蚯蚓属于什么门什么纲？ ===&lt;br /&gt;
有口有肛门有口有纲（肛）&lt;br /&gt;
&lt;br /&gt;
=== 性内选择 ===&lt;br /&gt;
有一次班上两个男的为一个女的打架，教练为了教导我们不要早恋，于是就问我们，他们两个人这是属于什么行为？有同学回答，不团结行为甚至有同学回答，违法行为，只有我一个人弱弱的说了一句性内选择。&lt;br /&gt;
&lt;br /&gt;
=== 这是什么选择 ===&lt;br /&gt;
2024年的三四月份，正是苦逼孤寂的停课时光，偌大的教室里只有ling与一位留级学姐持续内卷，并有机会进行不为人知的猎奇话题讨论。&lt;br /&gt;
&lt;br /&gt;
连续几套练习题到处是同性恋的相关研究，雄果蝇头尾相接围成一圈雌果蝇冷落圈内的图片隔三岔五地出现。&lt;br /&gt;
&lt;br /&gt;
某个下午我灵光一闪，摊开动物行为学问学姐：一个女生喜欢另一个女生，这是性间还是性内选择？&lt;br /&gt;
&lt;br /&gt;
学姐：......&lt;br /&gt;
&lt;br /&gt;
me：那两个女生为了同一个女生而竞争，是性间还是性内选择？&lt;br /&gt;
&lt;br /&gt;
学姐：......&lt;br /&gt;
&lt;br /&gt;
=== 胡罗唐诗集 ===&lt;br /&gt;
某奥赛教练因微信名而被学生尊称为胡萝卜，一日在进行生态行为复习时胡老师在大脑过载后突发恶疾，韦尼克区损坏导致进入化境，语言与思想难以李姐，故时人记之，曰《胡罗唐诗集》&lt;br /&gt;
&lt;br /&gt;
《胡罗唐诗集》&lt;br /&gt;
&lt;br /&gt;
土壤是壤土。&lt;br /&gt;
&lt;br /&gt;
酸雨主要成分是盐酸。&lt;br /&gt;
&lt;br /&gt;
红树林没有盐度周期性变化。&lt;br /&gt;
&lt;br /&gt;
触角腺和绿腺是皮肤腺。&lt;br /&gt;
&lt;br /&gt;
黄外光是红光。人看到的主要是红外光。&lt;br /&gt;
&lt;br /&gt;
无限的微分是自然对数的底?&lt;br /&gt;
&lt;br /&gt;
多度 丰度 频度不如直接用盖度表示优势度。&lt;br /&gt;
&lt;br /&gt;
=== 豌豆花的花语…… ===&lt;br /&gt;
是9331。&lt;br /&gt;
&lt;br /&gt;
=== 为什么说我是次生韧皮部 ===&lt;br /&gt;
因为我身边一圈周皮（舟批）&lt;br /&gt;
&lt;br /&gt;
===实验生物学家、理论生物学家和我===&lt;br /&gt;
&lt;br /&gt;
理论生物学家做不出实验，但是知道为什么。&lt;br /&gt;
&lt;br /&gt;
实验生物学家做得出实验，但是不知道为什么。&lt;br /&gt;
&lt;br /&gt;
而我是一个完美的生物学家，既做不出实验，也不知道是为什么。&lt;br /&gt;
&lt;br /&gt;
===喜欢孟德尔怎么办？===&lt;br /&gt;
答案是变成豌豆，这样孟德尔就会给你♂授♂精♂&lt;br /&gt;
&lt;br /&gt;
===想变成南梁怎么办？===&lt;br /&gt;
答案还是变成豌豆，这样孟德尔就会给你♂去♂雄♂&lt;br /&gt;
&lt;br /&gt;
=== 万艾可是抗生素 ===&lt;br /&gt;
万艾可能够治疗（抑制）ED&lt;br /&gt;
&lt;br /&gt;
ED在此处既指勃起功能障碍，又指代微生物的ED代谢途径&lt;/div&gt;</summary>
		<author><name>Shiningstars</name></author>
	</entry>
</feed>