我系数据库组连续发表高水平学术论文

2月15日,我系数据库组两篇研究论文:“Faerie: Efficient Filtering Algorithms for Approximate Dictionary-based Entity Extraction”(李国良、邓栋、冯建华)和“LazyFTL: A Page-level Flash Translation Layer Optimized for NAND Flash Memory”(马冬哲、冯建华、李国良)被数据库领域的顶级国际会议 ACM International Conference on Management of Data (ACM SIGMOD 2011) 接受为研究论文 (Full Research Paper)。两篇论文完全由清华大学计算机系的教师和学生独立完成。

李国良的论文主要解决了基于字典的实体抽取问题(例如网页中抽取人名、地名、商品名)。该方法有着广泛的应用前景,例如数据清洗、信息检索、自然语言处理、生物信息学等等。博士生马冬哲的论文提出了一种页级的闪存转换层,在不失系统可靠性的前提下,提高了闪存的使用效率。闪存转换层是工作在闪存芯片和文件系统之间的一层软件,负责管理闪存的存储单元。

ACM SIGMOD每年的录取率都在15%左右。SIGMOD 2011 (http://www.sigmod2011.org/)将于2011年6月12日-16日在希腊雅典举行。

此外,近期数据库组独立完成的论文“DBease: Making Databases User-Friendly Easily Accessible”(李国良、范举、吴昊、王健楠、冯建华)被The 5th biennial Conference on Innovative Data Systems Research (CIDR 2011)接受为研究论文(Full Research Paper)。CIDR是数据库领域偏向系统的会议,每两年召开一次,每次接受的论文20篇左右,在数据库领域具有相当高的学术地位。该篇论文是大陆学者在该会议上发表的第一篇论文。论文“Extending String Similarity Join to Allow Fuzzy Token Matching”(王健楠、李国良、冯建华)和“Interactive SQL Query Suggestion: Making Databases User-Friendly”(范举、李国良、周立柱)被数据库领域的顶级国际会议27th International Conference on Data Engineering (ICDE) (简称IEEE ICDE 2011) 接受为研究论文(Full Research Paper)。论文“Efficient Fuzzy Full-Text Type-Ahead Search”(李国良、姬声乐、李晨、冯建华)被The VLDB Journal接受为研究论文。论文“Finding Top-k Answers in Keyword Search over Relational Databases Using Tuple Units”(冯建华、李国良、王建勇)被 IEEE Transactions on Knowledge Data Engineering (IEEE TKDE)接受为研究论文。VLDB Journal和IEEE TKDE都是数据库领域的顶级国际期刊。