数据也是小金矿,纪念俺的第一桶金
数据也是小金矿,纪念俺的第一桶金参加一个科研数据共享之星评选大赛之有感
趁着兜里的奖金还热乎着,将第一次参加数据共享大赛的感悟记述于此与大家同勉。
接到一个数据堂的邮件邀请,说有个“爱科研、爱数据、更爱共享”科研数据共享之星评选大赛,就去看了看。做科研的人都知道,大家都有一个共同的痛苦经历,那就是为做研究的数据来源发愁,像清华、北大这些牛叉的单位还好,人家不用发愁,其它学校,嘿嘿,你懂的。去找数据,产生数据,已经成为我们必须经历的痛苦过程。每个人都想共享别人的数据,而不愿把自己的数据共享给别人。好吧,一看活动结束,为了银子,顺便还能当雷锋,我先从了,不就是发几条数据,多大点事,又不是抢鸡蛋!
结果还不错,哥中奖了(奖金保密),感兴趣的同学可以去活动页面http://www.datatang.com/Activity/201110_index.html一探,不过,活动已结束了,哥赶得早。
这次比赛感悟有三条:
一、数据是金矿乎?童鞋们,我们在项目实验中产生的过程数据的价值有多大?很多数据我们是自己产生的,常常做完项目就不管了,但对其他研究者却可能很有帮助;比如这次大赛有选手上传的六万条sina微博用户数据、renren网电影评论网页数据集这些数据对研究网络用户行为分析的兄弟姐妹,意义就非凡了。 结论:把实验室或项目过程中产生的数据金矿挖出来,发布到数据共享平台,换取咱们的银子,还能帮助别人,何乐而不为?这样不但有利于科学研究,也利于增加我们的零花钱撒。
二、大家关注的数据知识产权问题,说到知识产权保护,大家主要怕两点。第一,文章没发表前,关键数据必须保密;第二,如何保证引用者在引用研究型数据时,都注明出处。这个我认为应该由独立的不从事相关学科领域研究,又要懂得科研数据方面的第三方机构来监督运作。至于怎么协调共享和保护知识产权之间的平衡,我认为用交换比较合适。子曰:取之必先予之。
三、数据流动循环系统,大家都清楚,数据只有流动起来,才能产生最大价值。我们在开展一项研究时,第一件要做的事,可能就是搜索一下前人做过哪些研究、取得过哪些成果,尽量多地了解和自己研究课题相关的数据,这些研究型数据对我们来说可能非常有用。如果分享的数据都流通起来,带给其它人价值,其它童鞋又有相应的数据回流,成为一个循环系统,不亦乐乎?
好吧,总之一句话,数据是个小金矿,就看你怎么挖!
页:
[1]