看怎样定义大数据。很多人提到的data.table包处理几百万条数据还是挺快的,fread读进来只要十几秒,用dplyr包进行数据处理也很方便。可以去Kaggle上看看别人的scripts,这个网站上很多是census数据,数据量都不小,而且里面的script也很多都是用R或Python写的,适合初学者照猫画虎地学习模仿并加以运用。
版权声明:部分内容由互联网用户自发贡献,如有侵权/违规,请联系删除
本平台仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
本文链接地址:/dsj/215396.html