Archive for 08月, 2008

数据管理研究的问题

星期五, 08月 15th, 2008

数据管理要研究的问题本质上是 在各种计算环境下针对各种数据类型的各种计算问题。
大概有下面这些

  •  计算环境

单机, 分布式(P2P, Sensor Network), 并行
Flash Disk,多核,GPU,Cache

  • 数据类型

结构化数据(表),半结构化的数据(XML),无结构的数据(Web)

高维数据(多媒体数据…)
数据流
uncertain的数据

  • 计算问题

数据存取-索引结构
查询- 传统的查询操作, skyline, top-k, knn, keyword search, 自己定义一种查询(这个比较牛X)
数据挖掘 – 聚类
安全,隐私保护
信息集成 – schema mapping

而(计算环境 × 数据类型 × 计算问题)的笛卡尔乘积就构成了问题空间:-D
比如SIGMOD08
有这种比较古怪的
Monochromatic and bichromatic reverse skyline search over uncertain databases
还有这种比较有才的
EASE An Effective 3-in-1 Keyword Search Method for Unstructured, Semi-structured and Structured Data
可以找一个比较古怪的组合来做一下,嘿嘿~