推特 阿里云技术文档正文

数据类型_API手册_智能媒体管理

admin 阿里云技术文档 2020-02-11 209 0
阿里云服务器优惠

数据类型

Marker

IMM 使用 Marker 而不是传统意义的 Page / Limit 进行翻页。传入的参数名为 Marker ,标识着本次请求从该标记位开始向后列出。在返回值中称为 NextMarker ,即您下次翻页所需要传入的 Marker 值。

在获取任何列表时,IMM 不保证每次返回的数量(但总是小于最大数量限制)。当 NextMarker 不为空时,即便列表的总元素数量小于最大值(甚至为 0 ),也应将 NextMarker 传入进行翻页,以获取下一页的内容。

Remarks

RemarksA / RemarksB / RemarksC / RemarksD 参数是为使用者预留的筛选参数。使用者可以自己将所需要的信息记录在这两个字段中。在搜索等场景下,这两个字段可以以前缀匹配的方式作为搜索条件。

使用场景如:

  • 作为客户端权限字段存入:AdminGroup/AdminUserA/ 即可使用前缀过滤用户权限。
  • 作为客户端的相对路径存入:nas://path/to/file

Video

列出视频详细的 JSON Object,其中具体字段意义如下

Parameter Type Comment
Project string Project
SetId string SetId
VideoUri string 视频 OSS Uri
RemarksA string Remarks 标记信息
RemarksB string Remarks 标记信息
RemarksC string Remarks 标记信息
RemarksD string Remarks 标记信息
ExternalId string 外部 ID,用于和您的应用层的 ID (如果有)进行绑定
CreateTime string 视频加入 Set 的时间
ModifyTime string 视频在 Set 内被修改的时间
VideoWidth int 视频宽度
VideoHeight int 视频高度
VideoFormat string 视频格式,如 mp4
VideoDuration float 视频时长,单位秒
FileSize int 文件大小
VideoFrames int 帧数
SourceType string 来源类型,参考 Source 来源
SourceUri string 来源的 Uri,参考 Source 来源
SourcePosition string 相对来源的位置,参考 Source 来源
ProcessStatus string 视频处理的状态
ProcessModifyTime string 视频处理的更新时间
VideoTags []VideoTag 标签识别结果 参考 引擎结果四元组
VideoTagsStatus string 视频标签处理的状态
VideoTagsModifyTime string 视频标签处理的更新时间
VideoTagsFailReason string 视频标签处理的失败原因
Celebrity []VideoCelebrity 视频名人识别结果
CelebrityStatus string 视频名人处理的状态
CelebrityModifyTime string 视频名人处理的更新时间
CelebrityFailReason string 视频标签处理的失败原因

VideoTag

视频标签

Parameter Type Comment
VideoTagName string 视频标签
VideoTagEnName string 视频标签英文
VideoTagConfidence string 标签置信度

VideoCelebrity

Parameter Type Comment
CelebrityName string 名人
CelebrityNum string 出现次数
CelebrityLibraryName string 名人类别

Audio

列出音频详细的 JSON Object,其中具体字段意义如下

Parameter Type Comment
Project string Project
SetId string SetId
AudioUri string 音频 OSS Uri
AudioRate int 音频采样率
AudioFormat string 音频类别
FileSize int 文件大小
SourceType string 来源类型,参考 Source 来源
ModifyTime string 音频在 Set 内被修改的时间
SourceUri string 来源的 Uri,参考 Source 来源
CreateTime string 音频加入 Set 的时间
RemarksA string Remarks 标记信息
RemarksB string Remarks 标记信息
RemarksC string Remarks 标记信息
RemarksD string Remarks 标记信息
ExternalId string 外部 ID,用于和您的应用层的 ID (如果有)进行绑定
ProcessStatus string 音频处理的状态
ProcessModifyTime string 音频处理的更新时间
SourcePosition string 相对来源的位置,参考 Source 来源
AudioTexts []AudioText 音频转文字结果
AudioTextsStatus string 音频标签处理的状态
AudioTextsFailReason string 音频标签处理的失败原因
AudioTextsModifyTime string 音频标签处理的更新时间

AudioText

音频标签

Parameter Type Comment
Text string 文字
BeginTime float 开始时间
EndTime float 结束时间
SilenceDuration float 本句与上一句之间的静音时长,单位为秒
EmotionValue float 情绪能量值
ChannelId int 该句所属音轨ID
SpeechRate int 平均语速,单位为每分钟字数
Confidence float 置信度
Person string 所属人员
Library string 识别类型

Image

列出图片详细的 JSON Object,其中具体字段意义如下

Parameter Type Comment
Project string Project
SetId string SetId
ImageUri string 图片 OSS Uri
ImageWidth int 图片宽度
ImageHeight int 图片高度
ImageFormat string 图片格式,如 jpg
Exif string 图片原始 EXIF 信息,以 JSON Object 序列化后的格式存储
FileSize int 文件大小
ImageTime string 图片拍摄日期,该日期从 EXIF 信息获取,若无 EXIF 信息则无该项
Orientation string 图片旋转值,从 EXIF 信息获取
Location string 地理位置,从 EXIF 信息获取,格式为 lat,long ,以逗号分隔的浮点数
SourceType string 来源类型,参考 Source 来源
SourceUri string 来源的 Uri,参考 Source 来源
SourcePosition string 相对来源的位置,参考 Source 来源
RemarksA string Remarks 标记信息
RemarksB string Remarks 标记信息
RemarksC string Remarks 标记信息
RemarksD string Remarks 标记信息
ExternalId string 外部 ID,用于和您的应用层的 ID (如果有)进行绑定
CreateTime string 图片加入 Set 的时间
ModifyTime string 图片在 Set 内被修改的时间
Tags []Tag 标签识别结果 参考 引擎结果四元组
TagsStatus string 标签识别的状态
TagsFailReason string 标签识别的失败原因
TagsModifyTime string 标签识别的更新时间
Faces []Face 人脸识别结果
FacesStatus string 人脸识别的状态
FacesFailReason string 人脸识别的失败原因
FacesModifyTime string 人脸识别的更新时间
OCR []OCR OCR识别结果
OCRStatus string OCR识别的状态
OCRFailReason string OCR识别的失败原因
OCRModifyTime string OCR识别的更新时间
Celebrity []Celebrity 名人识别结果
CelebrityStatus string 名人识别的状态
CelebrityFailReason string 名人识别的失败原因
CelebrityModifyTime string 名人识别的更新时间
Address []Address 照片地理位置检测结果
AddressStatus string 照片地理位置检测的状态
AddressFailReason string 照片地理位置检测的失败原因
AddressModifyTime string 照片地理位置检测的更新时间

Tag

标签信息。

Parameter Type Comment
TagName string 标签名称
TagLevel int 标签级别,1-4
TagConfidence float 标签置信度
ParentTagName string 父级标签名称

Face

人脸信息。

Parameter Type Comment
FaceId string 人脸唯一 ID
FaceConfidence float 人脸置信度
FaceQuality float 人脸质量
Age int 年龄
Gender enum 性别,MALE / FEMALE
GenderConfidence float 性别置信度
Emotion string 心情 HAPPY / SAD / ANGRY / SURPRISED / SCARED / DISGUSTED / CALM
EmotionConfidence float 心情置信度
EmotionDetails map[string]float 七种心情对应的置信度
Attractive float 吸引力, 0~1
GroupId string 人脸分组 ID 。参考 人脸聚类功能
FaceAttributes FaceAttributes 人脸其他属性

FaceAttributes

人脸其他属性。

Parameter Type Comment
Beard string 胡子, NONE / BEARD
BeardConfidence float 胡子置信度
Race string 种族, WHITE / YELLOW / BLACK
RaceConfidence float 种族置信度
Mask string 面罩, NONE / MASK
MaskConfidence float 面罩置信度
Glasses string 眼镜, NONE / GLASSES / SUNGLASSES
GlassesConfidence float 眼镜置信度
FaceBoundary Boundary 人脸位置框
HeadPose HeadPose 头部朝向

HeadPose

头部朝向。取值范围均为 -180.0 ~ +180.0 ,单位为角度。在应用时,若值超过采信范围,则识别的准确性无法保证,在使用时建议忽略该人脸。

Parameter Type Comment
Roll float 面内偏转角,理论范围 -180 ~ +180 度,建议采信的范围是 -45 ~ +45 度。
Yaw float 人脸的左右偏转角,-180 ~ +180 度,建议采信的范围是 -80 ~ +80 度。
Pitch float 人脸的俯仰角,-180 ~ +180 度,建议采信的范围是 -30 ~ +30 度。

OCR

OCR 文字识别信息。

Parameter Type Comment
OCRContents string 文字内容
OCRConfidence float 文字置信度
OCRBoundary Boundary 文字位置框

Celebrity

名人检测信息。

Parameter Type Comment
CelebrityName string 姓名
CelebrityLibraryName string 分类
CelebrityConfidence float 人物置信度
CelebrityBoundary Boundary 人物位置框

Address

将 GPS 坐标 Location 转换为可读的地理信息的结果。

Parameter Type Comment
Country string 国家 / 地区
Province string 省(或同级)
City string 城市(或同级)
District string 区(或同级)
Township string 街道(或同级)
AddressLine string 完整地址

Boundary

位置框,单位为像素。

Parameter Type Comment
Left int 顶点 X 坐标,距离左端距离
Top int 顶点 Y 坐标,距离顶端距离
Width int 宽度
Height int 高度

引擎结果四元组

对图片、视频处理的结果,通常为如下四元组,以 Tags 标签识别为例

  • Tags:

标签识别结果,该元素是引擎处理后的结果信息,根据引擎功能不同而不同。

  • TagsStatus:

标签识别的状态,该元素是引擎运行的状态。可能值为:NotProcessed / Processing / Success / Failed 。分别表明未处理、处理中、成功、失败。使用者可以根据该状态标记位,决定读取结果、等待或重试。

  • TagsFailReason:

标签识别的失败原因。该元素是引擎的错误原因。当 XXXStatus 为 Failed 时,该值不为空。格式为

  1. [400 InvalidResource] Specified resource is too large. Please check.
  2. [HTTPStatusCode ErrorCode] ErrorMessage

当 HTTPStatusCode > 500 时,您可以提交 Ticket 给 IMM 处理。

  • TagsModifyTime

标签识别的更新时间。该元素是引擎操作的更新时间,当 TagsStatus 更改时更新。

Source 来源

一个 Set 内可以保存各种类型的媒体文件。有些媒体文件是其他媒体文件生成的。如视频在 IndexVideo 后,截取的帧图片也会存在相同的 Set 内。此时,可以通过 Source 相关参数来获知媒体文件之间的关系。

  • SourceType

来源的文件类型,目前可以为 videoimage 。使用 IndexImage 索引图片时,该图片的 SourceType 即为 image 。而使用 IndexVideo 索引视频时,视频截取的帧图片的 SourceType 即为 video

  • SourceUri

来源文件的 URI 。对于 IndexImage 索引的图片, SourceUri 和 ImageUri 是相同的。而 IndexVideo 索引视频产生的帧图片,SourceUri 为对应视频的 VideoUri 。

  • SourcePosition

相对来源文件的位置。

目前仅当图片的来源 SourceTypevideo 时,该字段定义为该图片帧处于源视频的时间轴位置。格式为 "00000000.010",即 %8.3f

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论

-----