开放科学工具箱
本文尝试谈谈对开放科学的理解以及整理部分参考线索。
- 前言:开放科学时代的到来
- Q1:理解科学
- Q2:开放科学是什么
- Q3: 如何获取高质量文献
- Q4: 如何高效管理文献
- Q5: 如何评价文献质量
- Q6: 如何获取并共享高质量数据
- Q7: 如何输出开放科学成果
- Q8:如何以开放学习的方式学习科学
- 开放科学工具箱学科模版
前言:开放科学时代的到来
作为普通人,你能想象:
- 你也能加入到搜索外星人的行动中去?
- 玩游戏,却是在帮助科学家解决重大问题,成果发表在《自然》这样的顶级刊物上?
- 你的微博随机散漫的情绪,却成为行为科学家建立模型,剖析人类情绪周期规律的来源?
作为研究者,你能想象:
随着人类族群整体步入集体智慧新时代之后,这一切来的速度比人们想象的更快。以下这张图是来自SetiLive外星智慧搜索项目的网站截图,截止今天,已经有5万多人边玩边加入搜索外星智慧的旅途。
未来已经来临,只是还未惠及所有人。类似于Harold Varmus这样的先行者们开创潮流;Michael Nielsen这样的分析者发现、总结并放大趋势;你呢?是假装山不在那里;还是加入进来,慢慢地来享受从山坡到巅峰的风景?
如同TonyYet所写:Q1:理解科学
谈论开放科学,首先必须理解科学的本质。
模式战胜随机
儒家有士,但是帝国从来没有处在主流位置的公知。群而不党、批判性思维训练(真正的)与不贪财,这三点,哪些公知能做到十年如一日?在科学领域,神仅存在于那些终极问题之上,是唯一与俗世利益无关的神。放大时间周期来看,你容易发现因为利益结党;因为情绪盲从;因为贪财放弃自由思想的公知,但是,你能想象科学会这样吗?
在各种俗世纷争中,常有人逼你站队。在众人均信奉的神、传奇、公知与常识、科学之间。我的站队是,我是无神论者,无论人造的还是历史的,一律不相信。中国历史告诉我们,社会心理学之父莫斯科维奇的观点,社会心理学就是一种关于常识世界、思想社会或者共识宇宙的科学。某种意义上,常识也是科学的一部分。问题得以简化,在神、传奇、公知与常识、科学这种对立之间,能被大时间周期证明的智者常选择科学。为什么?
按照欧洲从人类进化角度来说,选择理性、科学与逻辑,至少,你胜出的概率更大。因为它是用模式、概率、规律来战胜随机性。好的科学原理无不以遵从数学美原理为荣,它们从各个侧面,逼近人类大脑记忆本质,并深深铭刻在诸如书本这样的人类记忆共同体之内,得以被人们理解、运用并与随机化的世界沟通。
定义、验证与质疑
人们误解科学,常在于将实证看做其唯一,但它的本质是定义、验证与质疑。无论魔法世界还是修真世界,都存在一个基本准则:对事物进行定义并选取衡定标准,然后记录它,让实践碰撞它,最终促进新的诞生,这是真理之道。定义、验证与质疑,是为科学三部曲。
拿理性作为例子。反科学主义者常说人是非理性的,以此来贬低科学的价值。但科学的做法是,在理性的基础之上,又定义了人类行为的“有限理性”,比如先后研究它们荣获诺贝尔奖的心理学家、管理学家、计算机科学家西蒙与认知心理学家卡尼曼,这就是科学的做法。
西蒙与卡尼曼开展或者实证或者非实证的研究,验证了一些想法,这些想法慢慢归结于精炼的,能被进化周期中,较笨的那部分人脑记忆的东西,启发人们的现实生活,变成一种莫斯科维奇所说的生活常识。定义是反驳对事物的不可知论,验证则反驳的是科学离现实太远的指责,也就是传统意义上的科学无用论。人们常常忘记的是,离现实很远的研究离进化周期并不一定远。
质疑则是科学最大的贡献,在现代科学范式之下,通过术语、公理、逻辑、文献引用、同行评审、写作格式约定等手段,建立了一个性价比较高的、容易沟通的知识良性循环体系。在这点上,反科学主义者的民主份子,却没有意识到,这种体系的平等与民主远胜于政治领域的效率。在Web2.0诞生之前,实际上,科学写作、文献引用、格式约定,已经建立了一种类似于Web2.0的集体智慧进化。内隐的人类智慧从此通过科学外行指责的八股文,得以问之于世,并在一个无关名利、地位的较公平平台上予以讨论。所以,我们能够很自然地看到借助于文献引用的规律诞生的Google,我们更能在复杂网络研究中,看到Google 的PageRank算法。今天这个时代,除了大自然的山川地理网络与人类自身的基因神经网络,为数不多的时间跨度达到百年以上,卷入人类达到千万级别的复杂网络,总是少不了文献引用网络。如果说书本代表了人类的记忆共同体,文献则代表了人类记忆中偏模式规律的那部分记忆。
Q2: 开放科学是什么
为什么要谈论科学的反科学
开放是动词,意味着存在着对科学的封闭动作,它们是哪些?如何阻碍了人类卓越智慧的诞生?开放是名词,同样意味着存在一种封闭的科学,它们有什么缺点?又是如何违背了科学的本质?为什么,在上个世纪,甚至更早年代,开放科学并不成为热门话题?
是这些,也不仅仅限于这些,在阻碍了科学的发展。
- 培养机制:年轻科学家培养周期日益漫长,做的课题不少离人们现实生活较远,也谈不上什么离进化周期近与创新;
- 供求机制:不是每个领域需要那么多科学家,在一些科学领域,博士、博后也开始成为廉价劳动力,部分老资格的科学家拥有极其丰盛的资源,霸占着位置却不干创新的活;
- 期刊垄断:几大垄断科技期刊集团,低成本获取到科学家的学术论文,反过来以高价卖给科学家所在机构;
- 科学普及:在科学与现实生活中,鸿沟日深。不少科学工作者离开自己狭小的专业领域,对现实生活失去科学精神的解释力,信奉星座等,拥有科学知识日益不等于拥有科学精神;
- 封闭数据:利用人类公共资源获取的数据却成为每个实验室的私有财富,数据仅报告显著性数据,那些,可能启发下一个大智慧的非显著性数据被扔进废纸篓;
- 美的丧失:人们对科学失去鉴赏力,普通大众甚至专业领域的研究者们也难以评价什么是美的、好的、有益的、容易跨越时空,流传百年,有益人类进化的科学作品。
开放科学的主要元素
基于以上不满,在早年学术协作与开放期刊发表传统之上,借助于互联网、开源软件传统,越来越多科学家加入“开放科学”(Open Science)阵营,在科学知识的学习、传播、数据产生与获取、研究发表等诸多层面,采取了一些与传统不一样的做法,这股潮流,日益浩大,并成为运动。具体而言,每位“开放科学“理念或者运动的信奉者、参与者与领导者,坚持并发展其中的部分或者全部理念:
- 文献:以开放获取期刊为荣,尝试逐步放弃不支持开放获取的期刊,并相信同行的分享更胜于封闭的阅读;
- 数据:借助于互联网,通过众包的方式,开展大众参与进来的研究,获取真实地大样本数据,并主动将自己的数据以开放数据协议发布出来;
- 成果:除了在开放获取期刊或传统学术期刊上发表论文之外,更抛弃传统专利等做法,采取更开放的创新者专利协议、开放数据协议、知识共享协议,在研究过程中,广泛借助于开源软件,并开发各类开源软件,发布出去,让大众参与进来。
- 传播:让科学与大众更近,并踊跃参与各类开放性课程、开放性学习。
Q3: 如何获取高质量文献
如何免费获取期刊全文:开放获取期刊
开放获取期刊 (Open Access,简称OA)开始流行。什么是开放获取期刊 (Open Access,简称OA)?它仍然坚持了学术期刊的同行评审原则,但是所有文章均能免费获取全文。
目前,学术期刊出版方式逐步发生变革。近些年,开放获取期刊增长速度极快,并且已经增加了不少高引用、高质量的刊物:
截止今天,开放获取期刊门户网站DOAJ网站已经收录大量期刊,美国以1360本刊物位居第一,大陆以33本刊物以下为开放获取期刊重要链接:
- DOAJ网站收集了所有学科,支持OA的期刊。部分期刊还可免费发布论文。在我关注的心理学领域已有157本期刊。
- PLoS:已多次推荐。与心理学相关的主要是物理学尤其是复杂网络、计算机科学中的有关研究。
- frontiersin:含神经、认知、心理学等。
- Hindawi: 为数不多的,以开放获取期刊出版为业务的商业期刊出版机构。
同样,部分国内期刊与研究机构也支持开放获取,并整理了相应目录:
- 开放获取期刊列表
- 中科院开放获取期刊
- 中科院国家科学图书馆开放获取信息门户
- 开放获取期刊目录:一如既往地中国特色,既然开放获取了,还非要搞个验证码。
高质量文献源
BibDesk内置的文献数据源质量都不错,它们分别是:
除了开放获取期刊提供的文献源之外,同样,还存在大量高质量文献源。例如:- Google Scholar
- ACM
- CiteULike
- HubMed
- INSPIRE
- arXiv:开放获取期刊的先行者,论文侧重物理、数学与计算机领域。
- IACR (Cryptology)
- MAS:微软学术搜索。
首选为Google Scholar。记得在Google学术偏好设置中,修改文献导出格式,比如Endnote格式,如下图所示:
那么,就会在你的Google学术检索结果多出一条导出链接。以social network analysis 作为关键词,检索2010年以来的论文,结果如下图所示:
自发翻译了这本书,并即将在今年年中出版。
我们会发现,社会网络分析领域,2010年以来,Pajek这本书引用率较高,然后在豆瓣中,搜索,又可以发现一个开放科学的典型例子,一位非网络分析领域的医学研究者已经作为参考文献引用,直接点击“Import into EndNote”并导入即可。如果经常性导入文献较多,还可以借助于浏览器脚本等撰写自动化脚本。
除了以上文献源之外,还可以在BibDesk内置的商业订阅文献库、Endnote的在线商业数据库找到你所在领域的研究数据库。在心理学领域,本人常使用以下2个商业文献数据库:
学术会议、讲义、基金等共享网站
- videolectures:众多高质量,包括诺奖得主参与的学术会议视频、ppt合集。
- iamresearcher:你可以将它理解为一个基于学术文献、学术会议的SNS。
- conferencealerts:学术会议订阅。
- slideside:老牌,还要介绍吗?我的多数可以公开的ppt都放在这里。
- COS:超过33亿美元的基金申请记录查询与跟踪。
Q4: 如何高效管理文献
新兴文献管理软件与共享网站
借助于Web2.0技术,部分年轻科学家开始广泛参与到各类Web2.0文献协作网站,分享读过的文献:
- 支持部分全文下载,以参考文献为核心,研究者相互协作的mendeley。
- citeulike:它是LaTex配套的文献管理软件,当然,也可独立使用的BibDesk内置的文献管理网站之一。
- Zotero:以浏览器为基础的文献管理工具,目前已经支持chrome、firefox等多个浏览器。当你在各大文献数据库,读到好文献的时候,轻轻一按浏览器按钮,它就自动分析格式并保存在线数据库中。
以上三个网站,都是有相应配套文献管理软件的,并且天然以互联网为基础,支持Web2.0性质的文献共享、文献自动发现。
老牌文献管理软件
提到文献管理软件,不得不提到老牌的EndNote与老友创业团队开发的、国内市场占有率名列前茅的NoteExpress。国内外不少研究者仍然使用这类老牌文献管理软件,如何共享文献?
EndNote中,一个较好的习惯是,写完论文之后,借助于它的Export Traveling Library功能,将每篇论文的参考文献导出为一个新的Endnote文献管理库,如下图所示:
在