2010年09月 存档

数据处理的心得

2010年09月29日,星期三

不知道怎么回事,现在我在世界一流的研究所得访问,学习的大部分是数据处理,这个我以前从来没有考虑过得问题,我总以为那是工程师做的小事情,不是我这样的搞物理的人做的,但是随着我的深入学习,我发现:

1 大牛多的是,搞物理真的是比搞数据处理难得多的多,别说爱因斯坦了,就是kip也不是我辈能比得,牛校的博士是默认你已经会了博士的课程,让你去直接做工作的!不知道那些大牛是如何,什么时候完成的那些基础的学习。—-我真的什么也不会……

从理论方面,我们似乎可以回答第一个问题,或者说预测出第一个问题:我们的理论说有这么一个物理量,例如  反电子 (这个东西是狄拉克纯理论预言的?)前提是你坚信你的物理是对的。物理回答不了第二个问题。

数据方面,我们可以回答这两个问题:从一组数(大自然总能告诉我们一组数)中

1我们利用 阀值(性噪比) 总可以在一定程度(致信度)上找到一个 成为‘信号’的 物理量

2 我们利用 参数估计 可以确定这个‘信号’是多少。

然后我们需要回答的是,这个信号是什么? 大牛就可以自己造理论了……小孩就要从理论中找了。

其实往往是这样的 理论预言了一个物理量,然后我们设计试验,去找一组数,从这组数中提取的”信号”,如果信号确实和我们的理论说的物理量一样(数值一样,我们能测量的都是数-标量) 那么我们就说 这个理论是正确的(?似乎需要唯一性定理的证明),否则可能试验数据处理出了问题,因为我们数据处理的方法也不确定是不是正确的。不过在不同的(不同种类,同种类不同时或不同仪器)试验后,如果那几个试验都不和理论一样,绝多数人会否定理论。韦伯的结果只有他自己承认。

我是不是已经堕落了……

关注知识本身!!和别人学习就要学习人家最擅长的东西。

什么是统计?

2010年09月29日,星期三

“A decision was wise, even though it led to disastrous consequences, if with the evidence at hand indicated it was the best one to make; and a decision was foolish, even though it led to the happiest possible consequences, if it was     unreasonable to expect those consequences”

Herodotus, c.500 BC

(We should do the best with what we have, not what we wished we had.)

“Probability theory is nothing but common sense reduced to calculation”

Pierre-Simon Laplace

(1749 –1827)

Occam’sRazor

“Frustrafit perplura,quod fieri potestperpauciora.”—“It is vain to do with more what can be done with less.”

William of Occam

(1288 –1348 AD)

(Everything else being equal, we favour models which are simple.)

假设推断

2010年09月29日,星期三

strictly frequentist method 是 用似然比,用2种错误概念,使用备择假设,不使用验前分布。
The Bayesian would form posterior probabilities:。Bayesian 只利用验前分布回答某种事情发生个概率(验后分布),不做备择假设判断,似乎被噎死不能做假设推断。一个发生概率是95%,一个是94%,你能拒绝啥呢?

关键是,很多时候,对于frequestist 来说我们不知道噪声的似然函数,即时知道了,得到似然比的数学表达式,也不能,确定threshold
对于被噎死来说,验前分布也不是那么好得到,似乎每个人都可以有不同的回答,……

似乎在宇宙学尺度,Bayesian更有意义?

似乎我接受了 被噎死的哲学?
世界是独立于我们的还是我们感知的?回答这个问题显然被噎死,和frequentist 有2种不同的态度。

什么是好的检测‘信号’方法?

2010年09月29日,星期三

先回答下面的问题:
1你要找什么–信号。我们能否知道他们的特性?部分还是全部?
2数据里面除了你要找的,还有什么?我们能否知道这些不需要的东西的特性?

一般我们根据理论,只能知道 要找的东西的部分特性:例如某种引力波的波形,但是不能知道他们的参数具体值。
我们也只能知道这些不需要东西(噪声)的统计特性:我们不能预知这些东西随时间的准确变化,只能有比较精确的统计特性,例如均值,方差等。

什么是好的数据处理方法呢?
利用知道的性质,构造一个统计量(主要是因为我们只知道噪声的统计特性),这个统计量中噪声的贡献越小,信号的贡献越大我们越能探测到它。—–理论上说,知道得越多,如何建统计量就有更明确的目标,越容易探测。

因此需要数据点够多—统计特性才能稳定的体现,

作为一个刚入门的研究者的感想

2010年09月27日,星期一

作为在国际顶级学术期刊发表过跨领域(水)论文的在读博士,我愿意描述一下我的经历,希望有人给年轻人帮助,更希望有人指点下我,让我更好的前进。

1 科研准备

  • 选择导师/

个人感觉国内极品是》40岁左右海龟,最好是男性。因为这个年龄的海龟刚归国不久,年富力强,视野开阔,思想进步,事业起步不久,学生也不会很多,杂事也不很多,有足够的实力和精力为你未来科研道路铺路。

导师对于学生有2中极端,一种是完全放任,学生爱干嘛干嘛,到时候交文章就可以,适合于独立科研能力强的学生。另一种是安排你干什么你就干什么,几乎不需你思考,适合于混学位的学生。

绝大部分学生一开始的科研能力不强,且还想做点事情,于是极品导师是充分尊重你的研究兴趣,并且能全力给你提供帮助的。

  • 选择方向/

a 如果你和导师做完全一样的,你也许永远也超越不了他

b 如果你选择大家都会做的,出类拔萃会很难,

c  如果你选择大家都不会做的,你确定很快的能证明你的研究能力(一般来说就是发文章)进而站稳脚跟吗?

d 个人感觉,一开始最好选择一个上手不会很难且比较新的领域

  • 如果运气不是那么好,情况不是那么极品怎么办?/

a 如果你有足够的勇气(换导师,退学等)和能力(凭啥收你做学生?你有啥可以证明你能使用有限的资源去做大事?),那就去重新找你认为极品的导师和方向。如果你认为世上没有能和你匹配的极品老师和方向了,那么恭喜你,你升仙了。

b 我想大多数人不具备足够的勇气,更不具备足够的能力。所以我认为

任何人都有值得你学习的东西。如果你在某个导师的指导下,能用比导师少的时间超越此导师的成绩,那也才证明你在条件相同的情况下,可能比此导师更有能力。

c 任何成熟的学科,方向都凝结着n多人的智慧,都有值得欣赏的东西。至少,你可以把它当作一个数学问题来做吧?数学问题也没还有或者你没兴趣,你确定你搞得是科研吗?

d一个人如果能跟随一个不是那么出色的老师完成你不感兴趣的课题,并用很快的时间超越你的导师,那么你还害怕啥?未来不是掌握在你手中?那些天天以为自己有过人之处,却没机会施展的,除了抱怨啥也不干的人,才应该害怕未来。

e 安西教练对流川枫的那句,你先想办法成为日本第一人吧。值得我们深思。

  • 基础问题/

基础好当然没问题,基础不好也不是没救,因为科研是做新的东西,所以有些旧的东西差点也不是致命,你可以采取截断式学习法,迅速的学习相关领域的知识,而忽略其他的。

2 科研过程

发现问题 分析问题 解决问题,我想这基本就是科研的过程了。大部分人是从分析问题和解决问题入手的,因为发现问题的任务一开始是交给了导师。发现问题要求你对整个学科领域和自身素质的全面认识,要求最高。而分析问题和解决问题的过程绝大部分是民工劳动,例如英文表述,公式推导,数据处理,实验操作,图表制作,符合投稿要求的文件格式准备,每一个项都很是枯燥的但是必须的。我本人感觉我80%的时间都是在和无聊斗争。

真正让你感受科研快感的时刻不过是一开始从N多文献中发现一个别人没搞过而你很有可能搞得定的问题,和最后稿子被接受的那一刻(本人不是一个工作狂。。)。

另外我觉得知道如何选择合适你文章的刊物及其和审稿人大战也是评价一个人高等科研能力的标准之一。

不要整天想我要做出多么伟大的发现,而不去做一些小事情。看看当今物理,天文领域,称得上是令人兴奋的文章每年也不多,更不用说举足轻重了。。绝大部分的文章都是水文,不是种子文。但是在做一些民工,水文问题的时候,你心里一定要有一个值得一生关注的问题,说不定那天幸运的苹果会敲的你突然发现这民工问题的某些延展可以让你和牛顿相提并论。。。

3科研结果

发文章,通过同行评议,是我能想到最能证明能力的最简洁途径。

有文章不是万能的,没文章是万万不能的。文章是证明你科研能力最有效的工具,不同级别的文章,证明你不同级别的科研能力。