博士热水器故障码p73（博士热水器故障码ER）-维修星

本文目录一览

1.揭示细胞与氧气的秘密！英美3位科学家拿下诺贝尔生理学或医学奖
2.基辛格：“我从历史和教训中观察世界”
3.好书·推荐丨《重大出生缺陷与精准预防》：应对重大出生缺陷关键在预防
4.对话NIPS 2016最佳论文作者：如何打造新型强化学习观？

1.揭示细胞与氧气的秘密！英美3位科学家拿下诺贝尔生理学或医学奖

北京时间 10 月 7 日下午 5 点 30 分，2019 诺贝尔生理学或医学奖评选结果揭晓——诺贝尔委员会宣布，将此奖项颁发给 William G. Kaelin 教授、Peter J. Ratcliffe 教授、以及 Gregg L. Semenza 教授，以表彰三人对生物氧气感知通路的研究。

在众多基础医学研究中，人体内部的氧气调节机制一直是重点，尽管呼吸氧气是每个人都习以为常的事情，但人的细胞和组织究竟如何调节和适应氧气水平的变化，直至这三位科学家的研究，我们才得以一窥一二。

今年的诺贝尔生理或医学奖获得者，揭示了细胞如何感知和适应氧气变化，这一生命中最重要的适应过程之一的机制。他们为我们了解氧水平如何影响细胞代谢和生理功能奠定了基础，他们的发现也为抗击贫血、癌症和许多其他疾病的新策略铺平了道路。

William Kaelin 曾在 David Livingston教授的实验室中分离出了E2F蛋白，并发现它能够结合DNA，促进细胞增殖。在通常的情况下，E2F会被抑癌蛋白RB抑制，从而防止细胞过度分裂。然而当RB蛋白出现突变时，细胞就会不受控制地分裂，导致视网膜母细胞瘤的发生。

William G. Kaelin

哈佛大学

1992年，William在自己的实验室科研项目中，了解到了一种叫做von Hippel-Lindau 的遗传疾病。这种疾病的患者会在肾脏，肾上腺、胰腺以及中枢神经系统等位置生出肿瘤。William注意到，这些肿瘤都生长在血管丰富的部位，而且它们会分泌促红细胞生成素，刺激红细胞的产生。这些特点都表明，氧气可能在它们的生长中起到了关键作用。

在之后的研究中，他的团队在多种疾病中都发现了氧气在肿瘤形成过程中起到的作用。譬如肾癌患者的VHL基因往往会出现突变，导致人体内产生过量的VEGF（血管内皮生长因子），而这又会促进血管和红细胞的生成。基于这一原理，新药研发人员针对VEGF这一靶点开始研发新药。目前，FDA已经批准了多种用于治疗肾癌的VEGF抑制剂。

如今，Kaelin实验室主要研究方向为抑癌蛋白的功能，包括视网膜母细胞瘤蛋白（pRB）、肿瘤抑制因子pVHL、肿瘤抑制蛋白p53的同源蛋白p73等，使用多种分子和细胞方法了解这些蛋白如何阻止肿瘤生长。这项研究工作的一个长期目标是为开发新的抗癌策略奠定基础。例如，人们可以设想开发一种药物，选择性地杀死缺乏特定抑癌蛋白的细胞，或者模仿通常由抑癌蛋白执行的特定生化活动。

Peter J. Ratcliffe

Peter J. Ratcliffe是一位英国医学家、分子生物学家，现在牛津大学标靶发现研究所担任所长。他生于1954年3月14日，出生在兰开夏郡，母校兰开斯特皇家男子文法学校。后在剑桥大学和伦敦圣巴塞洛缪医院学习医学。于1978年毕业移居牛津，在牛津大学（Oxford University）接受肾脏医学培训，特别着重于肾脏氧合作用，主要以对缺氧的研究知名。1989年，他建立了一个新实验室以从事细胞氧传感途径的研究。我们目前对缺氧的大部分理解是来自Ratcliffe实验室。

Peter J. Ratcliffe 其在低氧方面的开创性工作而获得了许多奖项和荣誉，包括米尔恩·穆尔克基金会奖（1991）、格雷厄姆牛奖（1998）、国际血液净化学会奖（2002）、美国文理科学院外国荣誉会员（2007）、路易斯·让埃特医学奖（2009）、加拿大盖尔德纳国际奖（2010）、第24届Robert J.和Claire Pasarow心血管研究基金会奖（2011）、法国研究所勒富隆-德拉兰德基金会科学大奖（2012）、威利生物医学科学奖（2014年）、Albert Lasker基础医学研究奖（2016）、皇家学会布坎南奖章（2017）和马斯里奖（2018）等。

此外，他因在临床医学服务上的贡献而获得2014年新年荣誉骑士勋章。

Gregg L. Semenza

约翰霍普金斯大学

Gregg L. Semenza，出生自纽约，美国人，现为约翰·霍普金斯大学医学院教授，细胞工程研究所血管计划的主任。Semenza先后在哈佛大学获得了文学学士学位，在宾夕法尼亚大学获得了医学博士学位，在杜克大学医学中心完成了儿科住院医师的工作，并在约翰·霍普金斯大学进行了医学遗传学的博士后研究。Semenza博士于1990年加入约翰·霍普金斯大学。Semenza在2008年评选为美国科学院院士，2016年获拉斯克基础医学研究奖。

上世纪90年代，William G. Kaelin Jr. 和Gregg L. Semenza作出了革命性的发现，人类得以一探细胞在分子水平上感受氧气的基本原理，了解细胞内氧感受器的具体存在。他们的研究关键在于一种名为HIF的低氧诱导因子入。HIF 被证明是低氧环境相关基因的转录因子，能促进各种应对低氧的基因表达，在肿瘤发生、血管增殖、无氧代谢等细胞基本代谢调节中的核心事件。其中，1992 年, Gregg Semenza 在动物细胞内首次发现HIF-1，动物细胞内在氧气调节机制 HIF 首次进入人类视野。10年以后的2002 年，William Kaelin 和 Peter Ratcliff 的团队发现脯氨酰羟化酶（PHD）能够调节 HIF 的活性和稳定性，是打通 HIF 通路的“开关”

诺贝尔生理学或医学奖全盘点

在诺贝尔奖体系中，有一部分是颁布给那些在生理学界或医学界有杰出贡献的科研工作者，这就是诺贝尔生理学或医学奖。历届获奖人中不乏改变医学世界的牛人，例如发明青霉素的弗莱明，还有我国杰出科研工作者发现青蒿素的屠呦呦教授。

第一届诺贝尔生理学或医学奖的颁布是在 1901 年，现在就让我们来盘点下 1901 年到 2018 年间环绕诺贝尔生理学或医学奖发生的事情吧。

◆ 诺贝尔生理学或医学奖的数量

从 1901 年开始计算，一共有 109 届诺贝尔生理学或医学奖被颁发。其中有九年没有颁发相关奖项：1915、1916、1917、1918、1921、1925、1940、1941 以及 1942年。

那么为什么这些年都没有颁发诺贝尔生理学或医学奖呢？在诺贝尔基金会章程上写道：如果在考虑范围内的所有科学发现没有足够的重要性，奖金将被保存至下一年。如果第二年，仍然不能颁发奖项，那么奖金将纳入诺贝尔基金的受限资金中。而在第一次和第二次世界大战中，诺贝尔奖没有颁发。

◆ 共同分享和独享的诺贝尔生理学或医学奖

为什么诺奖可以共享呢？原因就写在诺贝尔基金会章程上：如果两项科学发现都有资格获得诺贝尔奖，那么诺贝尔奖的奖金可以平均分为两等分。如果两位或者两位以上的科学家参与了一项能获奖的科学发现，那么诺贝尔奖可以同时颁发给他们。但是，一届诺贝尔奖不能分给三位以上的获奖者。

◆ 获奖者的数量

据统计，1901 年至 2018 年间，前后共有 216 位诺贝尔生理学或医学奖获奖者。

◆ 获奖者的生日

获奖者中，最常见的生日是 5 月 21 日和 2 月 28 日。

图丨1923 年诺贝尔生理学或医学奖得主弗雷德里克·G·班廷

最年轻的获奖者：迄今为止，该奖项最年轻的获奖者是弗雷德里克·G·班廷（上图），他和他的助手于 1923 年因成功分离胰岛素而得奖，获奖的时候年仅 32 岁。

图丨1966 年的诺贝尔生理学或医学奖得主佩顿·劳斯

最年长的获奖者：佩顿·劳斯，他发现了病毒在某些癌症中所扮演的角色，因而获得 1966 年的诺贝尔生理学或医学奖，获奖的时候已经 87 岁了。

◆ 女性获奖者

全部 216 位获奖者中，只有 12 名是女性。而在这 12 人中，只有巴巴拉·麦克林托克（如下图）是独享诺奖，其余均和他人分享当年的诺奖。

图丨1983 年诺贝尔生理学或医学奖得主巴巴拉·麦克林托克

1947 - 格蒂·特蕾莎·科里

1977 - 罗莎琳·萨斯曼·耶洛

1983 - 巴巴拉·麦克林托克

1986 - 丽塔·列维-蒙塔尔奇尼

1988 - 格特鲁德·B·埃利恩

1995 - 克里斯汀·纽斯林-沃尔哈德

2004 - 琳达·巴克

2008 - 弗朗索瓦丝·巴尔-西诺西

2009 - 伊丽莎白·布莱克本以及卡罗尔·格雷德

2014 - 梅·布莱特·莫索尔

2015 – 屠呦呦

◆ 多次获奖者

迄今为止，还没有人能够获得两次或以上次数的诺贝尔生理学或医学奖。没准下一个就是你。

◆ 死后才获得诺贝尔生理学或医学奖的获奖者

历届诺贝尔生理学或医学奖得主中，没有人是在死后才获奖的。从1974 年开始，诺贝尔基金会章程已经明确表示，诺贝尔奖不能颁布给已经过世的科学工作者，而在宣布获奖后获奖人才去世的情况不在其列。

在 1974 年之前，诺贝尔奖颁发给已故科学工作者的案例也只有两例：1961 年诺贝尔和平奖得主（Dag Hammarskjöld）达格·哈马舍尔德以及 1931 年诺贝尔文学奖得主埃利克·阿克塞尔·卡尔费尔德（Erik AxelKarlfeldt）。

图丨 2011 年诺贝尔生理学或医学奖得主拉尔夫·斯坦曼（Ralph Steinman）

而在 2011 年诺贝尔生理学或医学奖的一份官方声明中表示，一位诺贝尔生理学或医学奖得主拉尔夫·斯坦曼（Ralph Steinman，如上图）在获奖前三天已经去世。但是，诺贝尔生理学或医学奖评审委员会还是决定将奖项颁发给他，因为在瑞典卡罗林斯卡研究所召开的诺贝尔大会上，委员会颁布奖项的时候并不知道斯坦曼教授已经离世。

◆ 诺贝尔生理学或医学奖获奖者的家庭树

科学伉俪：

图丨1947 年的诺贝尔生理学或医学奖得主卡尔·科里和格蒂·科里夫妇

卡尔·科里和格蒂·科里夫妇（Gerty Cori and Carl Cori，如上图）因发现糖原的催化转化原因同时获得1947年的诺贝尔生理学或医学奖；

图丨2014 年的诺贝尔生理学或医学奖得主梅·布莱特·莫索尔和爱德华·莫索尔夫妇

梅·布莱特·莫索尔和爱德华·莫索尔夫妇（May-Britt Moser and Edvard I. Moser）因发现构成大脑定位系统的细胞同时获得 2014 年的诺贝尔生理学或医学奖；

父子兵：

图丨汉斯·冯·奥伊勒-切尔平（左）和乌尔夫·冯·奥伊勒-切尔平（右）

汉斯·冯·奥伊勒-切尔平（Hans von Euler-Chelpin，化学奖）和乌尔夫·冯·奥伊勒-切尔平（Ulf vonEuler，医学奖）；

图丨阿瑟·科恩伯格（左）和罗杰·科恩伯格（右）

阿瑟·科恩伯格（ArthurKornberg，医学奖）和罗杰·科恩伯格（Roger D. Kornberg，化学奖）；

龙兄虎弟：

图丨简·丁伯根（左）和尼克拉斯·丁伯根（右）

简·丁伯根（Jan Tinbergen，经济学奖）和尼克拉斯·丁伯根（Nikolaas Tinbergen，医学奖）；

◆ 强制放弃诺贝尔生理学或医学奖

图丨1939 年诺贝尔生理学或医学奖得主格哈德·多马克（放弃）

只有一届诺贝尔生理学或医学奖被获奖者所在国当权者强制要求放弃领奖。二战期间，阿道夫·希特勒驳回三位德国科学家接受诺贝尔奖的请求，其中就有 1939 年的诺贝尔生理学或医学奖得主格哈德·多马克（如上图）。

另外两位科学家分别是 1938 年诺贝尔化学奖得主理查德·库恩以及 1939 年诺贝尔化学奖得主阿道夫·布特南特。不过，他们之后还是接收了诺贝尔奖证书和奖章，没有奖金。

◆ 获奖者以及他们的专业领域

获奖者涉足领域最普遍的是基因科学，共有 48 位科学家获奖。

◆ 上届诺贝尔生理学或医学奖得主

James P. Allison

安德森癌症中心（M. D. Anderson Cancer Center）

1996 年，Allison首次发现用抗体阻断T 细胞抑制分子（CTLA-4）可以增强免疫系统对肿瘤的免疫应答能力。受此启发，他提出了一个影响深远的新概念：通过阻断 T 细胞抑制通路来增强免疫应答，从而达到抗肿瘤的目的。这个概念为“免疫检查点抑制剂”（即阻断 T 细胞抑制通路的药物）的开发奠定了基础。他本人和 BMS 合作研发了易普利姆玛（ipilimumab），该药物在 2011 年被 FDA 批准（商品名 Yervoy TM）用于治疗转移性黑色素瘤。

James P. Allison出生于 1948 年 8 月，美国免疫学家，美国国家科学院院士。1973 年在德克萨斯大学奥斯丁分校获得博士学位。在 2012 年加入安德森癌症中心之前，詹姆斯曾先后在加州大学伯克利分校、斯隆-凯特林纪念癌症中心以及霍华德休斯医学研究所任职。目前是安德森癌症中心免疫系主任。2014年，曾荣获生命科学突破奖；2015 年获得拉斯克奖；2017 年获得沃尔夫奖；2018 年获得阿尔巴尼医学中心奖（Albany Medical CenterPrize）。

本庶佑（Tasuku Honjo）

京都大学

本庶佑，1942 年 1 月 27 日出生于日本京都，日本免疫学家。本科毕业于京都大学医学部。其父亲就是一名医生。1966 年大学毕业后，在京都大学附属医院作实习生，次年考入京都大学医学研究所生理系，1975 年取得京都大学医学博士。完成学业后，曾在京都大学、东京大学医学部任助手。同时也兼任卡内基研究所、美国国立卫生研究院客座研究员。1979 年任大阪大学医学部教授，1982 年兼任京都大学医学部教授，1984 年开始担任了京都大学基因实验设施的负责人。此后数十年，他又担任过弘前大学教授、京大研究科长、医学部学部长等职。2005 年开始转为京都大学教授。目前为美国国家科学院外籍院士，日本学士院会员，京都大学高等研究院特别教授。

1992 年本庶佑首次发现 PD-1（Programmed Cell Death Protein 1) 分子，并在动物实验水平证实，抑制 PD-1 会解除免疫细胞原先被癌细胞的抑制作用，使其全力对抗癌细胞。2006 年，他的团队开始就“抗 PD-1 疗法”进行临床试验，2012 年首次发表临床试验结果。2014 年，相关药物被开发出来，日本厚生劳动省批准其适用于部分皮肤癌和肺癌的治疗，2017 年 9 月，胃癌也被列入适用范畴。

◆ 诺贝尔生理学或医学奖的提名

在提名数据库中，你可以发现很多有意思的事情，比如说，奥地利神经学者西格蒙德·佛洛伊德（1856-1939，如下图），同时也是精神分析学界的奠基者，曾经先后32次被提名诺贝尔生理学或医学奖，却从来没有获奖。

图丨奥地利神经学者西格蒙德·佛洛伊德

1929 年，一位专家进入了诺贝尔生理学或医学奖评审委员会中，他表示佛洛伊德的工作没有进一步研讨的必要，因为他觉得这样的工作没有科学价值。也许佛洛伊德的工作就是这样不被诺贝尔生理学或医学奖评审委员会所接受。在 1936 年，佛洛伊德甚至被提名诺贝尔文学奖，提名者是他的相识，诺奖得主罗曼·罗兰。

诺贝尔奖的提名数据被尘封了 50 年之久，才展现在世人面前。

◆ 诺贝尔生理学或医学奖奖章

诺贝尔生理学或医学奖奖章是由瑞典雕塑和雕刻艺术家埃里克·林德伯格设计，图案描绘了一位医学天才正伸出手用碗收集从石缝中流出的水，尝试给怀中罹患疾病的少女解渴的画面。

◆ 诺贝尔生理学或医学奖证书

诺贝尔生理学或医学奖证书十分精美，可以说每一本证书都是一件艺术品。它们都是由瑞典或者挪威最顶尖的艺术家和书法家制作而成。

◆ 诺贝尔生理学或医学奖奖金

阿尔弗雷德·诺贝尔用他大部分的资产——超过3100万瑞典克朗（折合现在17亿200万瑞典克朗）——成立一个基金会，将基金所产生的利息每年奖给在前一年中为人类作出杰出贡献的人，以表彰那些对社会做出卓越贡献，或做出杰出研究、发明以及实验的人士。

◆ 单词“Laureates（获奖者）”的来源

图丨屠呦呦获奖

单词“Laureate（获奖者）”本义是戴着桂冠的人。在希腊神学中，阿波罗就是这样一个戴着桂冠出场的人。桂冠则是由月桂树（拉丁语：Laurusnobilis）的枝条和树叶编织成的圆形王冠。在古希腊，桂冠一般授予体育竞技的胜利者或是文学领域的佼佼者，是荣誉的象征。

2.基辛格：“我从历史和教训中观察世界”

据央视新闻客户端消息，当地时间11月29日，美国前国务卿亨利·基辛格在康涅狄格州的家中去世，享年100岁。

基辛格博士被称为“中国人民的老朋友”。1971年，他秘密访华，与中方携手促成了1972年尼克松总统对中国进行“破冰之旅”。

据央视新闻客户端报道，1971年7月9日中午，一架巴基斯坦民航波音707客机准时降落在北京南苑机场。叶剑英、黄华、熊向晖等人早已等候在此，迎接远方来客——美国总统特使、国家安全事务助理基辛格。机场没有举行任何仪式，简单的寒暄后，叶剑英陪同基辛格坐上车，朝钓鱼台国宾馆驶去。

在此之前，中美两国已处于长达22年相互隔绝的局面。为了打开中美交往大门，周恩来接受了美国的建议，同意美国派遣一位高级使节秘密访问中国。在巴基斯坦总统叶海亚·汗的热情帮助下，基辛格经过精心安排，于1971年7月1日开始了代号为“波罗行动”的秘密访华之旅，意思是此行像马可·波罗造访遥远的东方一样，充满了神秘和未知。

基辛格说，此行之前，总统尼克松给他定下了两个任务，一是商谈尼克松访华日期及准备工作；二是为尼克松访华进行预备性会谈。1971年7月9日下午4点，周恩来总理来到钓鱼台五号楼，中美双方的会谈正式开始。时任外交部翻译冀朝铸注意到，基辛格见到周总理“既紧张又兴奋”。

基辛格在北京一共停留了48个小时，先后同周恩来总理会谈超过17个小时，双方就中美关系正常化的一系列问题广泛交换了意见。7月16日，中美双方发表会谈公告，公告宣布，美国总统尼克松应邀将于1972年5月以前的适当时间访问中国。尼克松即将访华的消息震惊了全世界，中美关系的大门也从此悄然打开。

我们摘编了《基辛格谈基辛格》中的精彩内容，一起走进那段外交的历史。值得注意的是这些采访的谈话背景，它们只涉及基辛格在尼克松总统任期内服务的那段时间。

《基辛格谈基辛格》，[美] 温斯顿·洛德著，吴亚敏译，上海译文出版社，2023年10月。

“因此，一切均取决于对未来的某种构想。”

在我撰文写下美国的外交政策应遵循这一原则两年之后，尼克松总统要我担任他的国家安全事务助理。鉴于我们两人之间关系的历史，这个机会出乎我的意料。然而，设计一个用以指导外交政策的观念势在必行，是尼克松和我的共同信念。

一九六九年，尼克松政府接手了一副烂摊子，内外交困。我们竭力以战略眼光去应对这些挑战。虽然我已经对我们的历程写过很多文章，但这次呈现是非正式的和口头性的表述；这是我唯一的口述历史。我没有想过它最终会成形。温斯顿·洛德和凯·特·麦克法兰说服我参加一次为时一小时的采访，作为一系列关于尼克松外交政策的视频节目的圆满收官。他们为此所做的准备和决心，最终促成了六次采访。

和所有口述历史一样，我这个基本上也是相关案例的简短的摘要。我没有刻意去做自我批评。参加这场对话的人，都是我几十年来的同事和朋友。但是，他们探究了有争议的话题。他们的目的，是要以一种使我们的后代感兴趣的方式，提炼我对一九六九至一九七四年间的关键外交政策问题的看法，对接下去的几代人来说，这个时期有如古老的历史。

然而，这不仅仅是对重大事件的回忆。它有助于更深入地了解我与尼克松总统的关系，了解领导艺术、谈判艺术和外交政策的制定艺术。

这就是这些采访的来龙去脉，这些采访只涉及我在尼克松总统任期内服务的那些年头。他在以压倒性多数赢得总统连任之后，准备在充满希望的第二届任期、特别是在外交政策方面大显身手。我们完成了向中国的开放。我们与苏联的关系取得了进展。我们在中东有所建树。但是，水门事件、尼克松辞职、行政权力的侵蚀，以及国会监护权的重新抬头，都给福特政府维护美国信誉的努力带来了巨大的压力。在福特总统的领导下，我们设法继续推进与北京和莫斯科的关系、在中东取得进展、重塑我们在南部非洲的政策，并探索即将提上全球议程的种种挑战。

尽管自那个时代以来发生了许多变化，它的许多指导原则依然至关重要。有些则应重新考虑。美国的外交政策应该从战略蓝图出发，而不是对零散事件做出反应。政治家必须根据并不充分、往往是含糊不清的信息做出勇敢的决策。在谈判中，美国的出发点应当是明确阐述自己的需求，并理解谈判对手的历史、文化和目标。

最重要的，美国的领导力依然不可或缺，这一点没变。要实施美国的领导力，迫使我们整合我们的利益和价值观—— 正如半个多世纪前我在第一本书《重建的世界》中写的那样，要“努力协调我们认为是公正的和可能发生的事情之间的关系”。

对谈选摘

回首过去，你认为最重要的领导力是什么？

基辛格：人们首先要问的是，领导者应该做什么？任何领导者都面临一系列因时势的发展而出现的实际问题，我称之为战术层面的问题。除此之外，他还有一项任务，就是要把他的社会从原来所处的局面带到未曾有过的局面。这是对领导力的挑战，将不断出现的特定情况变成对未来的憧憬。

就第一项任务而言，它部分取决于社会的内部结构，部分取决于某种战术技巧。

在领导力方面，最需要的素质是品格和勇气。需要品格，是因为真正棘手的决策是 51∶49。平淡无奇的决策是在官僚主义的考虑过程中做出来的。但是，当处于危急关头，这意味着你决定要走的是某一条路，而不是另一条路。因此，你需要依赖道义的力量来做出决策，就本身而言，在做这个决策时，你几乎不可能拥有多数支持，因为你面对的是不熟悉的领域。你需要单打独斗的勇气走完这段路。

—— 《一政治家风范》 p5

尼克松是如何看待世界的？你是怎么看世界的？看到了什么机会？

基辛格：尼克松对外交政策的理解是极为概念性的。这是他最感兴趣的活动领域。在这个领域里，他没有遭遇过反对因素，而在和他有关的各种竞选活动中，他一直备受异议。他走遍了世界各地，每当出现某个问题时，他可以把出现的问题与他所见过的许多人中的某个人的个性联系起来。因此，对于任何问题，尼克松都从我们想要的最终解决方案的角度来考虑。他对讨论战术极不耐烦，尽管他也对这种讨论表现出兴趣。他认为总统的作用就是要实现最终目标。

所以，从一开始他就会着手处理这个问题，我们在这里是要做什么？他有一句我经常引用的格言：半途而废和一意做到底的代价是一样的，不如决心干到底。所以，你最好是一路干到底。这是他的许多决策的特点。在关键时刻人们会说：“噢，看看这些疯子。他们面对某一种局面时一直思维敏捷。”当尼克松采取这些行动时，其目的是精心谋算，让另一方意识到事态正在变得非常危险，不会想采取某种临界的步骤而陷入危机。

我思考的素材更多是历史性的和哲学性的。也就是说，我把我所研究过的历史情况以及我们可以从中吸取的教训进行类比，以此来观察世界。因此，在这个意义上，尼克松和我相辅相成。我们在应该关注的问题上彼此看法一致。但是，对我们两人来说，思考的素材各不相同。

—— 《二准备》 p21

基辛格（资料图来源：新华社）

我认为也要提醒人们，在过去的二十年里，美国与中国没有外交关系（指建交前）。

基辛格：中国在国外几乎没有外交官，因为他们在“文革”期间都被召回国了。一九六九年四月我们参加了夏尔·戴高乐的葬礼。在爱丽舍宫举行的一次招待会上，尼克松对我说：“中国大使，作为中国的代表也在场，如果你发现他身旁无人，就走到他跟前，告诉他我们想谈谈。”

但是没有发生这样的事，因为中国大使从来没有独自一人出现。我一直在寻找机会。这没有成功，我们得出一个想法，唯一可能发生这种情况的地方是在波兰，因为波兰一直是与中国对话的指定联络点，尽管已经有很多年没有进行对话了。因此，我们指示我们驻波兰的大使——我说的“我们”，指的是我指示他，当然是经尼克松的批准——他应该在下一次公共活动中（不管是什么活动），走到中国大使跟前，说我们想要对话。

美国大使认为“这是操纵着国务院的国家安全委员会的又一个恶毒的主动行为”，对此置之不理。顺便说一句，沃尔特·斯托塞尔大使是个杰出的人。所以我请他回华盛顿，让他去总统办公室。尼克松重复了这一指示，斯托塞尔在南斯拉夫大使馆的一场时装秀上这样做了。中国大使没有得到任何指示，就跑走了，我们的大使追上他，向他传递了这个请求。

那么，你们是怎样与中国人沟通的呢？

基辛格：嗯，我们还试过一条法国渠道。我们派了一个与戴高乐关系密切的人，他曾经任驻河内大使，因此认识越南战争中的共产党人一方。这事我们从来没有得到任何回复。无论如何，一九六九年夏天，尼克松在一次环游世界的访问中向巴基斯坦总统表达了同样的意思，说我们想要对话。

是因为知道巴基斯坦人和中国人很亲近吗？

基辛格：只是这样认为而已。我们不知道他们的关系有多亲密，大约两个月后我们得到了答复。现在回想起来，回过头来理解这件事，我们当时没有完全理解，中国人认为这可能是苏联要对他们发动进攻的时候了。当时的苏联部长会议主席阿列克谢·柯西金于九月在河内参加胡志明的葬礼，在回国途中改变了飞行方向，带着一条信息飞往北京。中国人认为他会带去最后通牒，因此他们的回应是只在机场与柯西金会谈，而且只是与周恩来会谈，而不是与毛泽东会谈。

——《三向中国开放》 p36-40

当尼克松说“我们要去做。我愿意冒不能举行首脑会议的风险。如果它意味着要放弃越南，我宁愿退出与苏联举行的首脑会议”时，你和他的关系如何？

基辛格：我同意他的看法，并鼓励他。

你同意他的观点，尽管整个官僚机构，所有的传统思维都说：“不，不，你们不能危及这次苏联首脑会议。”

基辛格：我同意要有一次激烈的反应。我没有料到他会下令封锁，但我认为这是一个极好的措施。

在你们的所有谈话中，我发现尼克松所做的事情，可能在美国政治上不得人心。

基辛格：当然。

然而他愿意冒这个险。他没有来找你说：“亨利，我得考虑国内的问题。”

基辛格：没有。尼克松问：“这符合国家利益吗？我们努力想要实现的是什么？”他的座右铭是：“与其半途而废付出同样的代价，不如破釜沉舟干到底。”因此，一旦尼克松看准了一条道路的方向，他往往会采取摆在他面前的最全面的解决办法，或者自己想出一种解决办法。

——《五谋求稳定对苏关系》 p72-p73

莫斯科首脑会议上发生了什么？

基辛格：有一个插曲是勃列日涅夫在克里姆林宫“绑架”了尼克松，说服他坐上他的车去他的别墅！把我们其他人抛在后面。

在克里姆林宫会议结束时，我们都应该坐着美国车队的车跟在勃列日涅夫的车后。但我们走出会议室时，勃列日涅夫对尼克松说：“我们一起走吧。”因此尼克松做了特勤局认为不可想象的事情。他跨上了一辆没有美国安全保障的外国制造的汽车，他们就这样走了。

我坐在另一辆车里，跟着他们，所以我在总统的车队里。但是温斯顿拿着所有简报册落在了后面。直到今天，我仍然不知道温斯顿是如何设法和他们谈的，让他们允许他坐上一辆去勃列日涅夫的别墅的车，据我所知，只有他一人。他在别墅里出现了。

安排尼克松做的第一件事是坐船，勃列日涅夫亲自开船——这是一次令人毛骨悚然的经历。但他回来时，温斯顿已经带来了所有的简报册。特勤局对勃列日涅夫的所作所为极为愤怒，因此，在勃列日涅夫的别墅里，他们把车开到门廊下挡住了门，这样总统就不可能再被“劫持”了！

——《五谋求稳定对苏关系》 p74-p75

你们就职时就知道你们的任务之一是结束越南战争。可以这样说吗？

基辛格：在某种程度上可以这样说。但这不是以损害美国捍卫盟友和自由事业的能力为条件。让我们记住，美国国内辩论中的暴力崇拜真正以这种形式出现，是在越南战争期间。当然，在那之前，民主党人和共和党人之间就存在着很大的分歧，但是，政府是一群犯下战争罪的骗子罪犯的这种论调，只是在这个暴力阶段才出现。结果是大规模的示威活动和抵制公共服务的活动，试图使华盛顿陷入停顿。这是在越南战争中发展起来的。

也把敌人美化成在道德上高人一等。

基辛格：是的，美化敌人。因此，无论我们采取什么行动，都被指控为延长战争的恶意行为，指控为出于某种说不清的原因，我们宁愿进行这场战争。我的一个同事曾经研究，如果我们听从《纽约时报》编辑部的建议，《纽约时报》会支持我们多长时间。研究结果表明，在尼克松政府初期，大约是六星期。在尼克松政府结束时，仅剩下几天。

——《六在越南寻求和平》 85

在秘密旅行以及随后的旅行中，您多次与周恩来会谈，几小时接几小时地和他探讨大局远景。与周恩来一起工作同后来与毛泽东一起工作有何不同？他们的方法有什么不同？

基辛格：周恩来是一个极具智慧和个人魅力的人。他在非凡的知识和非凡的耐心框架下进行谈判，从来没有企图宣称要维护力量的相对平衡。有时他非常强硬，但他在这些阶段中是在一个具有说服力的框架内进行谈判，表明我们都是认真的人，都决定朝着某个方向前进，我们将设法找到实现这个目标的最佳途径。因此，他会捡起一些小事——如果我们这方有人生病了，或者在以前有过某种联系——他总是想方设法去提及。但他从来没有想要去讨好某个人。

毛泽东是革命奉献的化身。他身上有支配一切的气势。就像在舞台上，一个伟大的演员在三十秒之内就吸引了观众。毛泽东并没有特别想说服你，他说的是格言。他几乎总是以一个问题开始谈话。与大多数政治家不同，他没有说：“我要说五点。”他会说：“你在考虑什么……”然后他会带你进入下一步，用苏格拉底式的对话来回答，然而在对话的不同阶段会被他冷嘲热讽的评论打断，这些评论传达出“不要试图愚弄这个研究人类弱点的专家”。

他的经典回应之一是：“你们美国人让我想起燕子，它们在暴风雨来临时飞到空中，挥动翅膀。但是，教授，你和我都知道，挥动翅膀并不会影响暴风雨的到来。”或者你告诉他一些有关谈判的事，然后他就脱口而出“慕尼黑……”，但这一切都是彬彬有礼地说出来的。他流露出知道世界将走向何方的信念，而你必须适应那个框架。

——《九谈判风格和人物侧记》 p135-p136

基辛格

我认为你的记者招待会对媒体很重要。您真的花了很多时间做这事。而且，它们更多是概念性的，而非战术性的。

基辛格：嗯，如果你看看我们花在演讲上的时间……

还有你写的外交政策报告。

基辛格：看看我们花在演讲上的时间和我们花在记者招待会上的时间，必须得有这些时间。在最初的几年里，每个星期五我都会召开一次记者招待会谈越南问题和其他问题。从来没有被泄密过。这就像哈佛大学的研讨会。我会给他们很好的解释。

我可以再举一个例子。有一次我乘坐“空军一号”，飞机后面有一个新闻小组。我走到后面和他们聊天。我们要去萨尔茨堡与萨达特会谈。我们降落后，《华盛顿邮报》的资深人士默里·马德打电话给我说：“你应该知道，记者团完全搞砸了。他们引用在旅途中听到的你说过的话，你不会相信的，他们会造成混乱。”于是我说：“我能做些什么？”他说：“你什么也做不了，因为你不应该知道记者团的报告说了什么。”“你能做的最好的事，”他说，“就是召开一次公开的新闻发布会，我会问你一个与那一主题有关的问题，然后你就可以说出我所知道的你所要说的真正的意思。如此他们就得引用你的话。”你能想象今天会发生这种事吗？

不，今天绝没有机会这么做。他们会急着把它印出来，让你看上去像个傻瓜！

——《十外交政策的过程》 p159

我们已经用了四十年来反思尼克松总统的外交政策。回头看看，今天怎么看待这份遗产？

基辛格：尼克松的基本贡献是建立一种外交政策的思维模式，这是开创性的。美国外交政策的传统思想是，重大的问题可以分割为个别的问题，逐个解决——事实上，如何解决问题就是问题。因此，我们会卷入一种似乎威胁到我们的生存或其他重大利益的局势，但很少涉及世界秩序的概念。

除了那些美国国父，以及“泰迪”·罗斯福外，尼克松是把外交视为一项大战略的美国总统。在他看来，外交政策通过平衡各国的自身利益，从结构上改善它们之间的关系，从而促进全球和平与美国的安全。而且他从相对长远的角度来思考这个问题。

当然，最明显的例子是中国。如果你看看尼克松对中国的看法，看看在尼克松主持下撰写的外交政策报告中所说的话，就会知道，他会从世界秩序的角度来探讨中国问题，既不是从任何特定危机的角度，也不是从越南的角度，尽管他看到了对越南的影响。

他认为，通过使中国参与国际制度，国际政治的整个格局将会发生转变，因为所有其他国家都必须考虑中国在新格局中的影响。他推测，只要中美关系使双方都对对方的地位产生信心，我们就有可能制造出一种局面，即美国与中国和苏联的关系会比中苏之间的关系更为密切。因此，我们就会有很强的讨价还价能力。他还认为，随着美国公众对和平前景的看法发生变化，我们的国内使命感将得到加强。

——《十一战略》 p164-165

（本文为独家内容，经出版方授权摘编自《基辛格谈基辛格》。）

原文作者/[美] 温斯顿·洛德

摘编/走走

编辑/张婷

3.好书·推荐丨《重大出生缺陷与精准预防》：应对重大出生缺陷关键在预防

防治重大出生缺陷是人们追求美好健康生活的基本保障，是每一个家庭都需要的基本医疗服务。对于有出生缺陷生育史的家庭来说更加迫切需要对患儿进行康复治疗和预防第二个孩子再次发生重大出生缺陷。

我国的出生缺陷发生率与其他中等收入国家的平均水平接近，但由于人口基数大，且近年来随着我国生育人群变化和对不孕症治疗水平提高，出生缺陷的发生风险升高，每年新增的出生缺陷病例总数庞大。出生缺陷已成为影响我国人口健康素质的公共卫生问题，严重制约我国婴儿死亡率进一步下降和人均期望寿命提高。

好书推荐

获得国家出版基金资助

入选“十三五”国家重点图书出版规划项目

《重大出生缺陷与精准预防》

张学朱宝生等编著

上海交通大学出版社

本书是“精准医学出版工程”丛书之一。丛书由中国工程院院士、北京大学常务副校长、医学部主任詹启敏院士担纲总主编，得到吴孟超、曾溢滔、刘彤华、贺福初、刘昌孝、周宏灏、赵国屏、王红阳、曹雪涛、陈志南、陈润生、陈香美、徐建国、金力、高福、周琪、徐国良、董家鸿、卞修武、陆林、田志刚、乔杰、黄荷凤、张学、王俊、陈薇、田伟等多位院士的鼎力支持，汇聚了活跃在精准医学研究最前沿的、在各自领域有突出贡献的一流专家的原创性研究成果和实践经验。已连续三期入选国家出版基金项目，全部书目均已入选“十三五”国家重点图书出版规划项目，首批出版的“精准医学基础系列”获得“第七届中华优秀出版物（图书）提名奖”。此次出版的“精准预防诊断系列”为第二期，共计13种图书，将为实现疾病预防控制的关口前移，减少疾病和早期发现疾病，实现由“被动医疗”向“主动健康”转变奠定基础，为推动“健康中国”建设提供重要参考。全套书为精装全彩，全铜版纸印刷。

本书作者作为重大出生缺陷领域国内外知名专家，以其多年的研究成果和临床工作经验为基础，对近年国内外重大出生缺陷防治研究进展及精准诊断、精准治疗的临床适宜技术进行了系统阐述。全书共20章，分别对产生出生缺陷的遗传和环境因素，以及防治方法进行了介绍。对各器官系统的重大出生缺陷按照以下3个原则选择了一些有代表性的病种，分别阐述其一级预防、二级预防和三级预防干预相关知识和临床应用技术。原则1，致死性和出生后医疗措施终生依赖的严重遗传病；原则2，相对常见并有重大生理功能障碍，导致终身严重残疾，生活不能自理的出生缺陷；原则3，相对常见并导致患者出现某种重要功能障碍，群众对患病胎儿有选择性人工流产要求的疾病。

本书力求能够为从事出生缺陷一级、二级、三级预防干预工作的妇幼卫生专业人士，以及对出生缺陷防治工作有浓厚兴趣的各界人士提供重要参考。

●主编简介●

张学，1964年出生。中国医科大学医学博士，中国工程院院士、教授、博士生导师，现任哈尔滨医科大学校长、党委副书记。历任中国医科大学细胞生物学研究所所长（兼）、中国医科大学基础医学院医学基因组学教研室主任（兼）、中国医学科学院基础医学研究所/北京协和医学院基础学院医学遗传学系主任、中国医学科学院/北京协和医学院院校长助理、中国医学科学院基础医学研究所/北京协和医学院基础学院党委书记、中国医学科学院/北京协和医学院副院校长等职。长期从事单基因病和基因组病的分子遗传学研究，发现多种单基因病的致病基因和基因组病的致病DNA重排。主要学术成果包括：① 发现肝癌中RB1基因突变失活。首次以全面、可信的证据确定RB1基因在肝癌发生和发展过程中的作用，第一次证明利用蛋白质免疫组织化学染色法检测抑癌基因失活更敏感、可靠；② 发现侯选抑癌基因p73新的多态和双等位基因表达现象；③ 发现V型并指（趾）症和一个新型短-并指（趾）综合征的致病基因。

承担国家高技术研究发展计划(863计划)、国家重点基础研究发展计划（973计划）和国家科技攻关计划等多项重大课题，主持国家杰出青年科学基金和国家自然科学基金重点项目、高技术探索项目、面上项目，以及教育部高等学校优秀青年教师教学科研奖励计划项目和美国国立卫生研究院（NIH）R03项目等科研课题。研究成果曾获辽宁省自然科学学术成果奖一等奖及教育部中国高校科学技术奖（自然科学奖二等奖）。兼任中国遗传学会理事兼人类与医学遗传专业委员会主任委员、中国医师协会医学遗传医师分会副主任委员，曾任中华医学会医学遗传学分会前任主任委员。同时担任《中华医学遗传学杂志》《遗传学报》《遗传》《中华儿科杂志》《医学分子生物学杂志》和《国际遗传学杂志》编委。在Cancer Research、American Journal of Human Genetics等期刊发表论文130余篇。

朱宝生，1964年出生。云南大学理学硕士，现任昆明理工大学附属医院/云南省第一人民医院遗传诊断中心主任，国家卫健委西部孕前优生重点实验室常务副主任，教授、博士生导师。长期从事遗传咨询、出生缺陷预防和生殖健康临床服务工作。主要学术成果包括：① 在云南省系统地建立起血清学产前筛查与遗传咨询、细胞遗传学产前诊断和高通量测序技术产前筛查胎儿常见非整倍体疾病的临床服务体系，参与编写《胎儿常见染色体异常与开放性神经管缺陷的产前筛查与诊断技术标准》（中华人民共和国卫生行业标准WS 322.1—2010）等重要技术文件；② 主持云南省地中海贫血流行病学调查，与国内研究机构合作采用二代测序技术进行地中海贫血携带者筛查，首次证明传统的血液学筛查漏检部分携带者，大幅度降低了防控成本。

承担国家自然科学基金、卫生部科学研究基金重大项目全国多中心研究子课题、国家卫计委“地中海贫血防控试点项目”子课题，以及云南省重大科技专项、重点项目等课题多项。获得云南省科学技术进步奖一等奖1项、二等奖2项，先后被授予云南省有突出贡献的优秀专业技术人才、国务院政府特殊津贴专家、云岭产业技术领军人才、云南省医学领军人才等荣誉。兼任国家卫生健康委员会全国产前诊断技术专家组成员和全国出生缺陷防治人才培训项目专家，中国优生科学协会副会长，中华医学会医学遗传学分会常委，中国医师协会医学遗传医师分会常委，《中华医学遗传学杂志》《中国实用妇科与产科杂志》等期刊编委。在Genetics in Medicine等国内外期刊发表论文100余篇。参编《实用产前诊断学》《胎儿遗传性疾病：诊断、预防、治疗》《产前诊断》和《妇产科医师行医必读》，主持编写《TORCH感染筛查、诊断与干预原则和工作流程专家共识》和《先天性巨细胞病毒感染筛查与临床干预指南》。

●总序●

“精准”是医学发展的客观追求和最终目标，也是公众对健康的必然需求。“精准医学”是生物技术、信息技术和多种前沿技术在医学临床实践的交汇融合应用，是医学科技发展的前沿方向，实施精准医学已经成为推动全民健康的国家发展战略。因此，发展精准医学，系统加强精准医学研究布局，对于我国重大疾病防控和促进全民健康，对于我国占据未来医学制高点及相关产业发展主导权，对于推动我国生命健康产业发展具有重要意义。

2015年初，我国开始制定“精准医学”发展战略规划，并安排中央财政经费给予专项支持，这为我国加入全球医学发展浪潮、增强我国在医学前沿领域的研究实力、提升国家竞争力提供了巨大的驱动力。国家科技部在国家“十三五”规划期间启动了“精准医学研究”重点研发专项，以我国常见高发、危害重大的疾病及若干流行率相对较高的罕见病为切入点，将建立多层次精准医学知识库体系和生物医学大数据共享平台，形成重大疾病的风险评估、预测预警、早期筛查、分型分类、个体化治疗、疗效和安全性预测及监控等精准预防诊治方案和临床决策系统，建设中国人群典型疾病精准医学临床方案的示范、应用和推广体系等。目前，精准医学已呈现快速和健康发展态势，极大地推动了我国卫生健康事业的发展。

精准医学几乎覆盖了所有医学门类，是一个复杂和综合的科技创新系统。为了迎接新形势下医学理论、技术和临床等方面的需求和挑战，迫切需要及时总结精准医学前沿研究成果，编著一套以“精准医学”为主题的丛书，从而助力我国精准医学的进程，带动医学科学整体发展，并能加快相关学科紧缺人才的培养和健康大产业的发展。

2015年6月，上海交通大学出版社以此为契机，启动了“精准医学出版工程”系列图书项目。这套丛书紧扣国家健康事业发展战略，配合精准医学快速发展的态势，拟出版一系列精准医学前沿领域的学术专著，这是一项非常适合国家精准医学发展时宜的事业。我本人作为精准医学国家规划制定的参与者，见证了我国精准医学的规划和发展，欣然接受上海交通大学出版社的邀请担任该丛书的总主编，希望为我国的精准医学发展及医学发展出一份力。出版社同时也邀请了吴孟超院士、曾溢滔院士、刘彤华院士、贺福初院士、刘昌孝院士、周宏灏院士、赵国屏院士、王红阳院士、曹雪涛院士、陈志南院士、陈润生院士、陈香美院士、徐建国院士、金力院士、周琪院士、徐国良院士、董家鸿院士、卞修武院士、陆林院士、田志刚院士、乔杰院士、黄荷凤院士等医学领域专家撰写专著、承担审校等工作，邀请的编委和撰写专家均为活跃在精准医学研究最前沿的、在各自领域有突出贡献的科学家、临床专家、生物信息学家，以确保这套“精准医学出版工程”丛书具有高品质和重大的社会价值，为我国的精准医学发展提供参考和智力支持。

编著这套丛书，一是总结整理国内外精准医学的重要成果及宝贵经验；二是更新医学知识体系，为精准医学科研与临床人员培养提供一套系统、全面的参考书，满足人才培养对教材的迫切需求；三是为精准医学实施提供有力的理论和技术支撑；四是将许多专家、教授、学者广博的学识见解和丰富的实践经验总结传承下来，旨在从系统性、完整性和实用性角度出发，把丰富的实践经验和实验室研究进一步理论化、科学化，形成具有我国特色的精准医学理论与实践相结合的知识体系。

“精准医学出版工程”丛书是国内外第一套系统总结精准医学前沿性研究成果的系列专著，内容包括“精准医学基础”“精准预防”“精准诊断”“精准治疗”“精准医学药物研发”以及“精准医学的疾病诊疗共识、标准与指南”等多个系列，旨在服务于全生命周期、全人群、健康全过程的国家大健康战略。

预计这套丛书的总规模会达到60种以上。随着学科的发展，数量还会有所增加。这套丛书首先包括“精准医学基础系列”的10种图书，其中1种为总论。从精准医学覆盖的医学全过程链条考虑，这套丛书还将包括和预防医学、临床诊断（如分子诊断、分子影像、分子病理等）及治疗相关（如细胞治疗、生物治疗、靶向治疗、机器人、手术导航、内镜等）的内容，以及一些通过精准医学现代手段对传统治疗优化后的精准治疗。此外，这套丛书还包括药物研发，临床诊断路径、标准、规范、指南等内容。“精准医学出版工程”将紧密结合国家“十三五”重大战略规划，聚焦“精准医学”目标，贯穿“十三五”始终，力求打造一个总体量超过60种的学术著作群，从而形成一个医学学术出版的高峰。

本套丛书得到国家出版基金资助，并入选了“十三五”国家重点图书出版规划项目，体现了国家对“精准医学”项目以及“精准医学出版工程”这套丛书的高度重视。这套丛书承担着记载与弘扬科技成就、积累和传播科技知识的使命，凝结了国内外精准医学领域专业人士的智慧和成果，具有较强的系统性、完整性、实用性和前瞻性，既可作为实际工作的指导用书，也可作为相关专业人员的学习参考用书。期望这套丛书能够有益于精准医学领域人才的培养，有益于精准医学的发展，有益于医学的发展。

本套丛书的“精准医学基础系列”10种图书已经出版。此次集中出版的“精准预防诊断系列”系统总结了我国精准预防与精准诊断研究各领域取得的前沿成果和突破，将为实现疾病预防控制的关口前移，减少疾病和早期发现疾病，实现由“被动医疗”向“主动健康”转变奠定基础。内容涵盖环境、食品营养、传染性疾病、重大出生缺陷、人群队列、出生人口队列与精准预防，纳米技术、生物标志物、临床分子诊断、分子影像、分子病理、孕产前筛查与精准诊断，以及健康医疗大数据的管理与应用等新兴领域和新兴学科，旨在为我国精准医学的发展和实施提供理论和科学依据，为培养和建设我国高水平的具有精准医学专业知识和先进理念的基础和临床人才队伍提供理论支撑。

希望这套丛书能在国家医学发展史上留下浓重的一笔！

北京大学常务副校长

北京大学医学部主任

中国工程院院士

2018年12月16日

●目录●

向上滑动阅览

4.对话NIPS 2016最佳论文作者：如何打造新型强化学习观？

机器之心报道

编辑：杜夏德、吴攀、微胖

当地时间 12 月 5 日，机器学习和计算神经科学的国际顶级会议第 30 届神经信息处理系统大会（NIPS 2016）在西班牙巴塞罗那开幕。本届最佳论文奖（Best Paper Award）获奖论文是 Value Iteration Networks。

2016 NIPS 最佳论文《Value Iteration Networks》的作者，是加州大学伯克利分校 Aviv Tamar、吴翼（Yi Wu）等人。这篇论文介绍了一个能学习设计策略，而不是被动的完全遵循策略的神经网络。同时，这种新的强化学习观并不是基于模型的（model-free）。机器之心第一时间联系到最佳论文的作者之一吴翼（Yi Wu），为我们详细讲述 VIN 的特点、应用方式和他的研究心得。

与最佳论文作者吴翼的对话

机器之心：谈谈你的研究方向和最近工作

答：我自己的研究兴趣比较广泛，主要考虑的问题是如何能够在 AI 模型中更好的表达人的先验知识，并利用这些人的已有知识，让模型利用更少的数据，做出更好的推断。

我做过的项目包括概率编程语言（probabilistic programming language）以及概率推理（probabilistic inference），层次强化学习（hierachical reinforcement learning）。

除此之外，这个假期我在北京的今日头条实验室做了 3 个月实习，期间利用层次化模型处理了一些与自然语言处理（natural language processing）相关的问题。回到 Berkeley 之后我也和一些相关教授合作，继续利用层次化模型做一些和 NLP 有关的问题。

机器之心：简单介绍一下《Value IterationNetwork》的主题及 VIN 网络应用的场景

答：VIN 的目的主要是解决深度强化学习泛化能力较弱的问题。

传统的深度强化学习（比如 deep Q-learning）目标一般是采用神经网络学习一个从状态（state）到决策（action）的直接映射。神经网络往往会记忆一些训练集中出现的场景。所以，即使模型在训练时表现很好，一旦我们换了一个与之前训练时完全不同的场景，传统深度强化学习方法就会表现的比较差。

在 VIN 中，我们提出，不光需要利用神经网络学习一个从状态到决策的直接映射，还要让网络学会如何在当前环境下做长远的规划（learn to plan），并利用长远的规划辅助神经网络做出更好的决策。

通俗点来说叫：授人以鱼不如授人以渔。不妨说大家生活在北京，那么要怎么才能让一个人学会认路呢？传统的方法就是通过日复一日的训练，让一个人每天都从天安门走到西直门，久而久之，你就知道了长安街周边区域大致应该怎么走，就不会迷路了。但是如果这个人被突然扔到了上海，并让他从静安寺走到外滩，这个人基本就蒙了。VIN 提出的 learning to plan 的意义就在于，让这个人在北京学认路的时候，同时学会看地图。虽然这个人到了上海之后不认识路，但是如果他会看地图，他可以在地图上规划出从静安寺到外滩的道路，然后只要他能知道自己现在处在地图上的什么位置以及周边道路的方向，那么利用地图提供的额外的规划信息，即使这个人是第一次到上海，他也能成功的从静安寺走到外滩。

在文章中，我们提出了一种特殊的网络结构（value iteration module），这种结构和经典的规划算法 value iteration 有着相同的数学表达形式。利用这种数学性质，VIN 将传统的规划算法（planning algorithm）嵌入了神经网络，使得网络具有长期规划的能力。

VIN 中所使用的特殊结构，value iteration module，在很多问题上都可以直接加入现有的强化学习框架，并用来改进很多现有模型的泛化能力。

机器之心：跟从 Russell 教授学习带来了哪些启发？

答：Berkeley 有着全世界最好的 AI 研究氛围和学者，我很幸运能够在 Berkeley 学习和研究。

我的导师 Stuart Russell 教授对我的影响是最大的。他改变了很多我对的科研观点和习惯，让我不要急功近利。在我比较艰难的时间段里他也不停的鼓励我，也对我在很多方面给予了很大的支持，信任和帮助。

此外我第一篇关于概率编程语言的论文也非常幸运得到了 Rastislav Bodik 教授的指导和帮助，不过很不凑巧，在我博士第一年结束之后他就被挖到了华盛顿大学（University of Washington）。

在强化学习方面，我得到了 Pieter Abbeel 教授，Sergey Levine 教授，Aviv Tarmar 博士，还有他们组里的很多博士生的帮助。他们都是领域里最厉害的学者，让我学到了非常多的东西。

在自然语言处理方面，我在今日头条实验室实习的时候得到了李磊博士的很多指导，回到 Berkeley 后，我和 David Bamman 教授也有合作，他也是圈内顶尖的学者，也总能给我提出很有价值的建议和指导。

机器之心：获得 BestPaper 是意料之中的事情吗？有什么感想？

答：大家知道消息的时候还是挺意外的，也很高兴。毕竟 best paper 是个很高的荣誉，这一次 NIPS 也有很多非常非常优秀的工作，能够被选中，大家都非常开心。

最佳论文：Value Iteration Networks

摘要

在本研究中，我们介绍了价值迭代网络（value iteration network, VIN）：一个完全可微分的神经网络，其中嵌入了「规划模块」。VIN 可以经过学习获得规划（planning）的能力，适用于预测涉及基于规划的推理结果，例如用于规划强化学习的策略。这种新方法的关键在于价值迭代算法的新型可微近似，它可以被表征为一个卷积神经网络，并以端到端的方式训练使用标准反向传播。我们在离散和连续的路径规划域和一个基于自然语言的搜索任务上评估了 VIN 产生的策略。实验证明，通过学习明确的规划计算，VIN 策略可以更好地泛化到未见过的新域。

引言

过去十年中，深度卷积神经网络（CNN）已经在物体识别、动作识别和语义分割等任务上革新了监督学习的方式。最近，CNN 被用到了需要视觉观测的强化学习（RL）任务中，如 Atari 游戏、机器人操作、和模拟学习（IL）。在这些任务中，一个神经网络（NN）被训练去表征一个策略——从系统状态的一个观测到一个行为的映射，其目的是表征一个拥有良好的长期行为的控制策略，通常被量化为成本随时间变化的一个序列的最小化。

强化学习（RL）中决策制定的连续性（quential nature）与一步决策（one-step decisionsin）监督学习有本质的不同，而且通常需要某种形式的规划。然而，大部分最近的深度强化学习研究中都用到了与监督学习任务中使用的标准网络十分相似的神经网络架构，通常由用于提取特征的 CNN 构成，CNN 的所有层都连在一起，能将特征映射到行动（action）的概率分布上。这样的网络具有内在的反应性，同时特别的一点是它缺乏明确的规划计算。序列问题中反应策略的成功要归功于该学习算法，它训练了一个反应策略去选择在其训练领域有良好长期结果的行动。

为了理解为什么一个策略（policy）中的规划（planning）是一个重要的要素，可以参考一下图 1（左）中网格世界的导航任务，其中的 agent 能观测其域的地图，并且被要求在某些障碍之间导航到目标位置。有人希望训练一个策略后能解决带有不同的障碍配置的该问题的其他几个实例，该策略能泛化到解决一个不同的、看不见的域，如图 1（右）显示。然而，根据我们的实验显示，虽然标准的基于 CNN 的网络能被轻易训练去解决这类地图的一个集合，它们却无法很好的泛化到这个集合之外的新任务中，因为它们不理解该行为的基于目标的形式。这个观察结果显示被反应策略（reactive policy）学习的计算不同于规划（planning），它需要解决的是一个新任务。

图 1：一个网格世界域的两个实例。任务在障碍之间移动到全局。

在这个研究中，我们提出了一个基于神经网络的策略（policy），它能有效地去学习规划（plan），我们的模型，termeda 值迭代网络（VIN），有一个可微分的「规划程序」，被植入了该神经网络结构。我们方法的关键是观测到经典值迭代（VI）规划算法可能由一个特定类型的 CNN 表征。通过将这样一个 VI 网络模块植入到一个标准的前馈分类网络中，我们就获得了一个能学习一个规划计算的神经网络模型。这个 VI 模块是可微分的，而且整个网络能被训练去使用一个标准的反向传播。这就让我们的策略简单到能训练使用标准的强化学习和模拟学习算法，并且直接与神经网络整合，用于感知和控制。

我们的方法不同于基于模型的强化学习，后者需要系统识别以将观测映射到动力学模型中，然后产生解决策略。在强化学习的许多应用中，包括机器人操纵和移动场景中，进行准确的系统识别是极其困难的，同时建模错误会严重降低策略的表现。在这样的领域中，人们通常会选择无模型方法。由于 VIN 仅是神经网络策略，它可以进行无模型训练，不需要进行明确的系统识别。此外，通过训练网络端到端可以减轻 VIN 中的建模误差的影响。

我们证明了 VIN 可以有效应用于标准的强化学习和模拟学习算法中的各种问题，其中包括需要视觉感知，连续控制，以及在 WebNav 挑战中的基于自然语言的决策问题。在训练之后，策略学习将观察映射到与任务相关的规划计算中，随后基于结果生成动作预测的计划。正如我们所展示的结果，这种方式可以更好地为新的，未经训练的任务形式的实例归纳出更好的策略。

结论和展望

强大的和可扩展的强化学习方法为深度学习开启了一系列新的问题。然而，最近很少有新的研究探索如何建立在不确定环境下规划策略的架构，目前的强化学习理论和基准很少探究经过训练的策略的通用性质。本研究通过更好地概括策略表示的方法，朝着这个方向迈出了一步。

我们提出的 VIN 方法学习与解决任务相关的大致策略并计算规划，同时，我们已经在实验中证明，这样的计算方式在不同种类任务中具有更好的适用性，从简单的适用性价值迭代的网格世界，到连续控制，甚至到维基百科链接的导航。在未来的研究中，我们计划向基于模拟或最优线性控制学习的方向开发不同的计算规划方式，并将它们与反应策略相结合，从而为任务和运动规划拓展新的强化学习解决方案。

长按二维码阅读论文

以下是最佳论文《Value Iteration Networks》相关的演讲幻灯片介绍，演讲者为该论文的第一作者、 Berkeley AI Research Lab (BAIR) 博士后 Aviv Tamar。

P1-6：介绍

对于自动化机器人的目标（比如命令机器人打开冰箱给你拿牛奶瓶），用强化学习可以吗？深度强化学习从高维的视觉输入中学习策略，学习执行动作，但它理解这些策略和动作吗？可以简单测试一下：泛化到一个网格世界中。

P7-10：观察：反应性策略（reactive policies）的泛化效果并不好。

为什么反应性策略的泛化效果不好呢？

一个序列任务需要一个规划计算（planning computation）

强化学习绕过了它——而是学习一个映射（比如，状态→Q 值，状态→带有高返回（return）的动作，状态→带有高优势（advantage）的动作，状态→专家动作，[状态]→[基于规划的项]）

Q/返回/优势：在训练域（training domains）上的规划

新任务：需要重新规划（re-plan）

P11：在这项成果中，我们可以学习规划和能够泛化到未见过的任务的策略。

P12-14：背景

P16-21：一种基于规划的策略模型

从一个反应性策略开始

加入一个明确的规划计算

将观察（observation）映射到规划 MDP

[Image: https://dx903567.quip.com/-/blob/ZGWAAAmgzbz/PJmsMbEdvlUK-WTHNGTf9g] 假设：观察可被映射到一个有用的（但未知的）规划计算

神经网络将观察映射成奖励和转变（transitions）

然后，学习这些

怎么去使用这种规划计算？

事实 1 ：值函数 = 关于规划的足够信息

思路 1：作为特征向量加入反应性策略

事实 2：动作预测可以仅需要 V-*的子集

类似于注意模型，对学习非常有效

策略仍然是一个映射 g ϕ(s) → Prob(a)

映射 R-、P-、注意的参数 θ

我们可以反向传播吗？

反向传播怎么通过规划计算？

P22-23：价值迭代=卷积网络

P24-27：价值迭代网络（VIN）

P28-29：实验

问题：

1.VIN 能学习规划计算吗？

2.VIN 能够比反应策略泛化得更好吗？

P30-46：网格世界域

P47-51：火星导航域

P52-59：连续控制域

P60-72：网页导航域：基于语言的搜索

P73-76：总结和展望

总结

学习规划→泛化

用于基于规划的神经网络策略的框架

由动态编程理论所激励

可微分规划器（VI = CNN）

神经网络的组合性（compositionality）——感知 & 控制

利用灵活的先验知识

简单易用

展望和讨论

不同的规划算法

MCT

最优控制（Optimal control）

逆向强化学习（Inverse RL）

如何获得近似规划问题

Atari 中的游戏手册

强化学习中的泛化

理论？

基准？

算法？

泛化 ≠ 终身强化学习，迁移学习

分层策略，但不是选择/技能等等

博士热水器故障码p73（博士热水器故障码ER）

1.揭示细胞与氧气的秘密！英美3位科学家拿下诺贝尔生理学或医学奖

2.基辛格：“我从历史和教训中观察世界”

3.好书·推荐丨《重大出生缺陷与精准预防》：应对重大出生缺陷关键在预防

4.对话NIPS 2016最佳论文作者：如何打造新型强化学习观？

相关推荐

家电维修故障排行榜出炉！问题最多的竟是它