公开数据集
信息
长天ML公开数据集包含了很多由逸思长天团队调研的各行业的开源数据集,每个数据集都包含了数据本以及数据的源信息。
如何获取长天ML数据集?
方式一:通过链接直接下载。
在浏览器中数据输入相应的网址,即可进行下载。
方式二:使用changtianml的python包进行数据下载。
这里假定用户已经安装好了Anaconda环境,该环境是用于快速安装Python环境的工具,然后运行如下命令搭建预测环境。
# 创建Python虚拟环境
conda create -n changtian python==3.10 -y
# 激活虚拟环境
conda activate changtian
# 安装预测框架依赖
pip install changtianml -i https://pypi.tuna.tsinghua.edu.cn/simple/
然后创建一个python文件(以.py为后缀的文件)。
from changtianml import load_dataset
# 指定数据集对应的字符串,具体可查询附录中表格进行下载
obj = load_dataset('stock_info') # load_dataset方法会返回的是一个类
# 获取数据
data = obj.data
# ...
附录
| 数据集名称 | changtianml本地包加载字符串 |
|---|---|
| 股票信息 | stock_info |
| 机票价格 | flight_price |