存储系统中的人工智能


时间:2020-09-20

存储系统中的人工智能

| 预备队员 董思琪

2020年8月28日,Dian团队线上分享会邀请了华中科技大学武汉光电国家实验室教授周可来分享存储系统中的人工智能技术。周可教授同时也是中国计算机学会杰出会员,入选教育部新世纪优秀人才,华中科技大学-腾讯公司智能云存储技术联合研究中心主任,主要从事云存储、智能存储方向的研究。

关于存储系统中的人工智能,周可教授首先给出了一个定义,即利用存储系统运行过程中产生的数据,采用人工智能技术对其分析,从而应对存储系统复杂性的挑战。

接着,周可教授介绍了当前已经取得成果的4个工作方向:缓存、磁盘故障预测、数据库自动调参和资源分配。针对缓存,周可教授提到,他们与腾讯合作时,观察到两个现象:客户端61.5%的数据无第二次访问;同时命中率还有10%的提升空间。由此,便引出两个问题:延长SSD(固态硬盘)寿命和改进缓存性能。最终通过决策树的优化,SSD写入明显下降并且命中率显著上升。此外,云盘缓存中由于单个缓存服务器通常会对应多个存储服务器,倘若直接平均分配,势必会造成负载不均匀、利用率低下,也可以通过在线学习的方式对其做动态调整。而对于磁盘故障预测,周可教授主要提到了一种现象,就是由于产品不断更新换代,同一厂商同一型号的磁盘数量并不多,这导致较依赖硬件环境的预测系统的预测效果一般。而通过先在大量相同磁盘学习后使用迁移学习,很好地解决了问题。数据库自动调参方面则是使用深度强化学习,使调优后的性能比资深数据库管理员做得更好。最后,在资源分配问题上,周教授提到云盘的容量、IOPS(Input/Output Per Second 每秒读写次数)和频宽的分配十分不均匀,最后采取了智能分配的方式来解决这一问题。

之后,周可教授还对未来的研究做出了展望,指出当前基本上只应用了机器学习中的感知决策能力,而对影响更深远的内容认知能力的挖掘还比较少。他举例说到,识别图片时通过一定方式对图片数据生成hash值,通过设计让相似图片的hash值也相近,能极大程度地缩短以图搜图所消耗的时间。

周可教授言深入浅出地将人工智能在存储系统中的应用娓娓道来,即使是对存储和人工智能了解尚浅的队员也能从周教授的生动讲述中收获良多。十分感谢周可教授,相信周教授的分享内容能对队员们的发展产生更深远的指导!