标签: DataAnalysis

如何对连续型数据进行分箱 - Python

在做数据分析时,经常要对连续型数据进行分箱。面临的主要问题是:怎么分箱才是最优的? 一个常见的场景是,老板想看用户在不同年龄段的占比以及消费情况,这时如果将所有年龄全部展示出来会话,表格会非常长,不容易阅读。一般情况下,我们会把相近的年龄做一个区间,来展示不同年龄区间数据。这就需要用到分箱,把年龄划分成不同...