mindspore.dataset.vision.DecodeVideo

查看源文件
class mindspore.dataset.vision.DecodeVideo[源代码]

将输入的视频原始字节解码为视频、音频。

支持的视频格式有AVI、H264、H265、MOV、MP4和WMV。

异常:
  • RuntimeError - 如果输入不是一维序列。

  • RuntimeError - 如果输入数据的数据类型不是 uint8。

  • RuntimeError - 如果输入数据为空。

支持平台:

CPU

样例:

>>> import numpy as np
>>> import mindspore.dataset as ds
>>> import mindspore.dataset.vision as vision
>>>
>>> # Use the transform in dataset pipeline mode
>>> # Custom class to generate and read video dataset
>>> class VideoDataset:
...     def __init__(self, file_list):
...         self.file_list = file_list
...
...     def __getitem__(self, index):
...         filename = self.file_list[index]
...         return np.fromfile(filename, np.uint8)
...
...     def __len__(self):
...         return len(self.file_list)
>>>
>>> dataset = ds.GeneratorDataset(VideoDataset(["/path/to/video/file"]), ["data"])
>>> decode_video = vision.DecodeVideo()
>>> dataset = dataset.map(operations=[decode_video], input_columns=["data"], output_columns=["video", "audio"])
>>>
>>> # Use the transform in eager mode
>>> filename = "/path/to/video/file"
>>> raw_ndarray = np.fromfile(filename, np.uint8)
>>> mindspore_output = vision.DecodeVideo()(raw_ndarray)