数据管理研究的问题
星期五, 08月 15th, 2008数据管理要研究的问题本质上是 在各种计算环境下针对各种数据类型的各种计算问题。
大概有下面这些
- 计算环境
单机, 分布式(P2P, Sensor Network), 并行
Flash Disk,多核,GPU,Cache
- 数据类型
结构化数据(表),半结构化的数据(XML),无结构的数据(Web)
图
高维数据(多媒体数据…)
数据流
uncertain的数据
- 计算问题
数据存取-索引结构
查询- 传统的查询操作, skyline, top-k, knn, keyword search, 自己定义一种查询(这个比较牛X)
数据挖掘 – 聚类
安全,隐私保护
信息集成 – schema mapping
而(计算环境 × 数据类型 × 计算问题)的笛卡尔乘积就构成了问题空间:-D
比如SIGMOD08
有这种比较古怪的
Monochromatic and bichromatic reverse skyline search over uncertain databases
还有这种比较有才的
EASE An Effective 3-in-1 Keyword Search Method for Unstructured, Semi-structured and Structured Data
可以找一个比较古怪的组合来做一下,嘿嘿~