Release Notes
MindSpore Pandas 0.2.0 Release Notes
主要特性和增强
[STABLE] 提供了基于共享内存的数据管道,数据无需落盘即可从MindSpore Pandas数据处理进程传输至MindSpore训练进程,解决了数据分析框架与AI训练框架割裂的问题。
[STABLE] 简化单机多进程模式使用方式,无需手动部署分布式计算引擎。
[STABLE] 支持Python3.9。
[STABLE] 增加了落盘功能,当datamem使用率超过预设的阈值时使用磁盘空间。
[STABLE] 优化分布式计算引擎冷启动时间。
[STABLE] 优化多进程模式内存占用。
[STABLE] 重构统计类和比较类API,并提升部分性能。
API 变更
[STABLE] 新增API
mindpandas.DataFrame.memory_usage
。[STABLE] 新增API
mindpandas.DataFrame.count
。[STABLE] 新增API
mindpandas.DataFrame.product
。[STABLE] 新增API
mindpandas.DataFrame.var
。[STABLE] 新增API
mindpandas.DataFrame.prod
。[STABLE] 新增API
mindpandas.Series.prod
。[STABLE] 新增API
mindpandas.Series.isin
。[STABLE] 新增API
mindpandas.Series.item
。[STABLE] 新增API
mindpandas.Series.cummin
。[STABLE] 新增API
mindpandas.Series.count
。[STABLE] 新增API
mindpandas.Series.cummax
。
Bug Fixes
[BUGFIX] 修复了
read_csv
无法处理URL的问题。[BUGFIX] 修复了
drop
API在某些情况下计算结果错误的问题。[BUGFIX] 修复了当使用
yrctl start
启动分布式计算引擎过程时出错,需要手动退出的问题。[BUGFIX] 修复了设置代理后分布式计算引擎无法启动的问题。
贡献者
感谢以下人员做出的贡献:
caiyimeng, chenyue li, dessyang, liyuxia, lichen_101010, Martin Yang, panfengfeng, RobinGrosman, shenghong96, Tom Chen, wangyue, weisun092, xiaohanzhang, xutianyu, yanghaitao, youtianming
欢迎以任何形式对项目提供贡献!