Archive for 09月, 2007

google 与 百度 的中秋logo

星期二, 09月 25th, 2007

google2007年

�秋

2006年

moon_festival06.gif

2005年

moon_festival05.gif

韩国,八月十五是感恩节

kr_thanksgiving07.gif

百度中秋节logo:

slogo-07zhongqiu.gif
这个logo居然是幾米画的,还是挺温馨的。

2006年百度的中秋节logo,以李白为主题:

slogo_06zhongqiu.gif

Powered by ScribeFire.

今天跑过去听腾讯的宣讲会了

星期二, 09月 25th, 2007

中秋下午16:00在450做的宣讲会,据说每人要发一个月饼。于是,冲着月饼我就跑过去了。讲话的是腾讯的一个HR,一个劲地在那里吹腾讯的产品,实在是无聊。无奈,腾讯的产品我都不太喜欢(QQ属于被迫使用,中国的QQ用户群实在是太庞大了)。本来想混个月饼吃的,但还没等发月饼就饿得不行。于是就偷偷溜出来了。
sigh~最遗憾的是没吃上月饼。其次,那几个QQ公仔挺可爱的:-),要是能拿到就好了。

Powered by ScribeFire.

db的一些研究方向

星期一, 09月 24th, 2007

从ssos师兄的主页上看到的Research Interest,十分精辟

XML Database How to manage massive data in form of XML?
sensor network How to detect and manage data from physical world?
graph database How to manage very large graph?
Compressed Database How to store and query massive data efficiently with the method of compression?
WEB Database How to extract, store, query, mining the data from web?
Information Integration How to query and mining the data from heterogenous data sources in a distributed envrionment?

Powered by ScribeFire.

哈尔滨转冷

星期一, 09月 24th, 2007

刚才穿一件外套就出去了,发现哈尔滨好冷啊。昨天去江边的时候还没有这样冷,才过一天哈尔滨的夜间最低温度就到8度了。家里还是24多度的天气吧。

Powered by ScribeFire.

计算机工程专业,如何找paper?[zz]

星期一, 09月 24th, 2007

http://zeal.haliluya.org/blog/2006/05/26/how-to-find-computer-engineering-papers/

学了几年的Computer Engineering,虽然学无所成,但是对于怎么找到专业相关的paper(尤其是电子版)还是有一点心得。今天特总结一下,供后来人参考。本文应该也普遍适用于Computer Science。

1. 搜索引擎,这个其实是最简单有效的方法了。

推荐使用:

Google Scholar

Citeseer

DBLP

Google
Scholar对每一篇paper一般能返回若干个结果,可以点开group看,默认结果通常是链接向ACM或者IEEE的Digital
Library的,是收费的。如果你的学校没有订阅的话,你是下载不了的。所以最好在group里面寻找一个链向作者主页的,实验室主页之类的,通常可以
直接下载。Citeseer里面,很多文章的电子版都直接在citeseer的数据库里,可以直接下载。DBLP本身不提供论文下载,但是相当一部分
paper是有链接指向ACM和IEEE的。DBLP的好处是对论文进行了系统的分类,按作者,按会议,按期刊等等。Citeseer主要是根据
citation来把paper串起来的。

2. ACM Digital Library

如果你所在的学校和机构订阅了ACM Digital
Library的话,那么这里是一个不错的跟踪ACM会议和期刊的好地方。因为ACM的期刊和会议一般都是该领域内最好的之一。所以,建议
Graduate
Student们养成定期到这里看最新的会议proceedings和最新的transaction的习惯,尤其是conference的
proceedings
(计算机专业重conference)。ACM因为会议和期刊并不是很多(从而也保证了相当的质量),所以分类很清晰。而且一篇paper的
citation也尽量提供了链接。

ACM Journals

ACM Transactions

ACM Conference Proceedings

3. IEEE Computer Society Digital Library

如果你跑到ieee.org,而不是computer.org,你会发现那里paper不是那么容易找。其实计算机专业的,到computer.org更容易找paper一点。这里也是需要订阅的,不是免费的。另外一方面,IEEE的会议多而杂,有好的会议,但是绝大部分会议是不如ACM的,所以在这里跟会议的proceedings一定要有针对性。 IEEE的几个magzine还是做得挺不错的,可以读读。

4. 寻找BibTeX

如果你用LaTeX写论文的话,手边备有几个地方可以找到现成的BibTeX entry还是很省事的 (平时自己一定要积累,比如没看一篇paper,都把相应的bibtex entry整理好,放进自己的bib文件)。

ACM Digital Library的每篇文章,都提供BibTeX的。IEEE则不提供。Citeseer也提供能找到的文章的BibTeX,DBLP也是。另外还有一个网站,专门收集paper的BibTeX,叫做The Collection of Computer Science Bibliographies,也是一个不错的地方。

经常需要用的就是这些了,其实不用我这篇文章,大家也都知道。 也欢迎同行们来补充一下。

Powered by ScribeFire.

Sources About DB

星期一, 09月 24th, 2007

Database Research and Development by Area
http://www-ccs.cs.umass.edu/db/research-areas.html

University of Washington database group
http://data.cs.washington.edu/

Stanford CS346 Database System Implementation  http://infolab.stanford.edu/~widom/cs346/

berkeley CS262 Readings in Database Systems  http://db.cs.berkeley.edu/cs262/syllabus.php
http://redbook.cs.berkeley.edu/redbook3/lecs.html

VLDB2007 http://www.vldb2007.org/(点击左侧Best Paper Awards)

Powered by ScribeFire.

Resources About Research

星期一, 09月 24th, 2007

为学之道 
http://www.jdl.ac.cn/how_to_research/index1_1.htm#0

Advice on Research and Writing
http://www.cs.cmu.edu/~mleone/how-to.html

Hints for research students http://www.virtosphere.de/schillo/research/tips.html#presentingPaper

Graduate Research, Writing, and Careers in Computer Science  http://www.cs.iastate.edu/~honavar/grad-advice.html

A Reading List for Computer Scientists 
http://john.regehr.org/reading_list/#fic

Powered by ScribeFire.

Internet Innovation & Business Opportunities (互联网创新与商业机会)

星期日, 09月 23rd, 2007

周五,MSRA的洪小文博士来工大做的一个讲座,还是很受启发的。21世纪初的确是网络的世纪,网络带来了各种奇迹,让人觉得确实不可思议。
Internet现在有多少个节点我们不得而知。古人说“聚沙成塔”,“滴水穿石”从未像今天这样真实。也正因为如此,无论是科学还是商业,带给我们的都是前所未有的机会。

Powered by ScribeFire.

python的标准输入输出

星期五, 09月 21st, 2007

python的标准输入输出在模块sys中
>>> import sys
>>> for i in range(3):
… sys.stdout.write(’Dive in’) 2
Dive inDive inDive in

Powered by ScribeFire.

[Python]Walking Directory Trees[zz]

星期六, 09月 8th, 2007

Walking Directory Trees

Credit: Robin Parmar, Alex Martelli

Problem

You need to examine a directory, or an entire directory tree rooted in a certain directory, and
obtain a list of all the files (and optionally folders) that match a certain pattern.

Solution

os.path.walk is sufficient for this purpose, but we can pretty it up quite at bit:


[sourcecode language='python']

import os.path, fnmatch

def listFiles(root, patterns='*', recurse=1, return_folders=0):# Expand patterns from semicolon-separated
string to list
pattern_list = patterns.split(';')
# Collect input and output arguments into one bunch
class Bunch:
def _ _init_ _(self, **kwds): self._ _dict_ _.update(kwds)
arg = Bunch(recurse=recurse, pattern_list=pattern_list,
return_folders=return_folders, results=[])
def visit(arg, dirname, files):
# Append to arg.results all relevant files (and perhaps folders)
for name in files:
fullname = os.path.normpath(os.path.join(dirname, name))
if arg.return_folders or os.path.isfile(fullname):
for pattern in arg.pattern_list:
if fnmatch.fnmatch(name, pattern):
arg.results.append(fullname)
break
# Block recursion if recursion was disallowed
if not arg.recurse: files[:]=[]
os.path.walk(root, visit, arg)

return arg.results
[/sourcecode]
Discussion

The standard directory-tree function os.path.walk is powerful and flexible, but it can be confusing
to beginners. This recipe dresses it up in a listFiles function that lets you choose the root folder, whether to
recurse down through subfolders, the file patterns to match, and whether to include folder names in the result list.

The file patterns are case-insensitive but otherwise Unix-style, as supplied by the standard fnmatch module, which
this recipe uses. To specify multiple patterns, join them with a semicolon. Note that this means that semicolons
themselves can't be part of a pattern.

For example, you can easily get a list of all Python and HTML files in directory /tmp or any subdirectory thereof:

thefiles = listFiles('/tmp', '*.py;*.htm;*.html')