mindspore.dataset.ArgoverseDataset
====================================

.. py:class:: mindspore.dataset.ArgoverseDataset(data_dir, column_names="graph", num_parallel_workers=1, shuffle=None, python_multiprocessing=True, perf_mode=True)

    加载argoverse数据集并进行图（Graph）初始化。

    Argoverse数据集是自动驾驶领域的公共数据集，当前实现的 `ArgoverseDataset` 主要用于加载argoverse数据集中运动预测（Motion Forecasting）场景的数据集，具体信息可访问官网了解：
    https://www.argoverse.org/av1.html#download-link。

    参数：
        - **data_dir** (str) - 加载数据集的目录，这里包含原始格式的数据，并将在 `process` 方法中被加载。
        - **column_names** (Union[str, list[str]]，可选) - dataset包含的单个列名或多个列名组成的列表。默认值：'Graph'。当实现类似 `__getitem__` 等方法时，列名的数量应该等于该方法中返回数据的条数，如下述示例，建议初始化时明确它的取值如：`column_names=["edge_index", "x", "y", "cluster", "valid_len", "time_step_len"]`。
        - **num_parallel_workers** (int, 可选) - 指定读取数据的工作进程数/线程数（由参数 `python_multiprocessing` 决定当前为多进程模式或多线程模式）。默认值：1。
        - **shuffle** (bool，可选) - 是否混洗数据集。当实现的Dataset带有可随机访问属性（ `__getitem__` ）时，才可以指定该参数。默认值：None。
        - **python_multiprocessing** (bool，可选) - 启用Python多进程模式加速运算。默认值：True。当传入 `source` 的Python对象的计算量很大时，开启此选项可能会有较好效果。
        - **perf_mode** (bool，可选) - 遍历创建的dataset对象时获得更高性能的模式（在此过程中将调用 `__getitem__` 方法）。默认值：True，将Graph的所有数据（如边的索引、节点特征和图的特征）都作为图特征进行存储。

    异常：
        - **TypeError** - 如果 `data_dir` 不是str类型。
        - **TypeError** - 如果 `num_parallel_workers` 不是int类型。
        - **TypeError** - 如果 `shuffle` 不是bool类型。
        - **TypeError** - 如果 `python_multiprocessing` 不是bool类型。
        - **TypeError** - 如果 `perf_mode` 不是bool类型。
        - **RuntimeError** - 如果 `data_dir` 无效或不存在。
        - **ValueError** - `num_parallel_workers` 参数超过系统最大线程数。

    **关于Argoverse数据集：**

    Argoverse是第一个包含高精地图的数据集，它包含了290KM的带有几何形状和语义信息的高精度地图数据。

    可以将数据集文件解压缩到以下结构中，并通过MindSpore的API读取：

    .. code-block::

        .
        └── argoversedataset_dir
            ├── train
            │    ├──...
            ├── val
            │    └──...
            ├── test
            │    └──...

    **引用：**

    .. code-block::

        @inproceedings{Argoverse,
        author     = {Ming-Fang Chang and John W Lambert and Patsorn Sangkloy and Jagjeet Singh
                   and Slawomir Bak and Andrew Hartnett and De Wang and Peter Carr
                   and Simon Lucey and Deva Ramanan and James Hays},
        title      = {Argoverse: 3D Tracking and Forecasting with Rich Maps},
        booktitle  = {Conference on Computer Vision and Pattern Recognition (CVPR)},
        year       = {2019}
        }


    .. py:method:: load()

        从给定（处理好的）路径加载数据，也可以在自己实现的Dataset类中实现这个方法。

    .. py:method:: process()

        针对argoverse数据集的处理方法，基于加载上来的原始数据集创建很多子图。
        数据预处理方法主要参考：https://github.com/xk-huang/yet-another-vectornet/blob/master/dataset.py。

    .. py:method:: save()

        将经过 `process` 函数处理后的数据以 numpy.npz 格式保存到磁盘中，也可以在自己实现的Dataset类中自己实现这个方法。

.. include:: mindspore.dataset.api_list_vision.txt