数据类型
Marker
IMM 使用 Marker 而不是传统意义的 Page / Limit 进行翻页。传入的参数名为 Marker ,标识着本次请求从该标记位开始向后列出。在返回值中称为 NextMarker ,即您下次翻页所需要传入的 Marker 值。
在获取任何列表时,IMM 不保证每次返回的数量(但总是小于最大数量限制)。当 NextMarker 不为空时,即便列表的总元素数量小于最大值(甚至为 0 ),也应将 NextMarker 传入进行翻页,以获取下一页的内容。
Remarks
RemarksA / RemarksB / RemarksC / RemarksD 参数是为使用者预留的筛选参数。使用者可以自己将所需要的信息记录在这两个字段中。在搜索等场景下,这两个字段可以以前缀匹配的方式作为搜索条件。
使用场景如:
- 作为客户端权限字段存入:AdminGroup/AdminUserA/ 即可使用前缀过滤用户权限。
- 作为客户端的相对路径存入:nas://path/to/file
Video
列出视频详细的 JSON Object,其中具体字段意义如下
Parameter | Type | Comment |
---|---|---|
Project | string | Project |
SetId | string | SetId |
VideoUri | string | 视频 OSS Uri |
RemarksA | string | Remarks 标记信息 |
RemarksB | string | Remarks 标记信息 |
RemarksC | string | Remarks 标记信息 |
RemarksD | string | Remarks 标记信息 |
ExternalId | string | 外部 ID,用于和您的应用层的 ID (如果有)进行绑定 |
CreateTime | string | 视频加入 Set 的时间 |
ModifyTime | string | 视频在 Set 内被修改的时间 |
VideoWidth | int | 视频宽度 |
VideoHeight | int | 视频高度 |
VideoFormat | string | 视频格式,如 mp4 |
VideoDuration | float | 视频时长,单位秒 |
FileSize | int | 文件大小 |
VideoFrames | int | 帧数 |
SourceType | string | 来源类型,参考 Source 来源 |
SourceUri | string | 来源的 Uri,参考 Source 来源 |
SourcePosition | string | 相对来源的位置,参考 Source 来源 |
ProcessStatus | string | 视频处理的状态 |
ProcessModifyTime | string | 视频处理的更新时间 |
VideoTags | []VideoTag | 标签识别结果 参考 引擎结果四元组 |
VideoTagsStatus | string | 视频标签处理的状态 |
VideoTagsModifyTime | string | 视频标签处理的更新时间 |
VideoTagsFailReason | string | 视频标签处理的失败原因 |
Celebrity | []VideoCelebrity | 视频名人识别结果 |
CelebrityStatus | string | 视频名人处理的状态 |
CelebrityModifyTime | string | 视频名人处理的更新时间 |
CelebrityFailReason | string | 视频标签处理的失败原因 |
VideoTag
视频标签
Parameter | Type | Comment |
---|---|---|
VideoTagName | string | 视频标签 |
VideoTagEnName | string | 视频标签英文 |
VideoTagConfidence | string | 标签置信度 |
VideoCelebrity
Parameter | Type | Comment |
---|---|---|
CelebrityName | string | 名人 |
CelebrityNum | string | 出现次数 |
CelebrityLibraryName | string | 名人类别 |
Audio
列出音频详细的 JSON Object,其中具体字段意义如下
Parameter | Type | Comment |
---|---|---|
Project | string | Project |
SetId | string | SetId |
AudioUri | string | 音频 OSS Uri |
AudioRate | int | 音频采样率 |
AudioFormat | string | 音频类别 |
FileSize | int | 文件大小 |
SourceType | string | 来源类型,参考 Source 来源 |
ModifyTime | string | 音频在 Set 内被修改的时间 |
SourceUri | string | 来源的 Uri,参考 Source 来源 |
CreateTime | string | 音频加入 Set 的时间 |
RemarksA | string | Remarks 标记信息 |
RemarksB | string | Remarks 标记信息 |
RemarksC | string | Remarks 标记信息 |
RemarksD | string | Remarks 标记信息 |
ExternalId | string | 外部 ID,用于和您的应用层的 ID (如果有)进行绑定 |
ProcessStatus | string | 音频处理的状态 |
ProcessModifyTime | string | 音频处理的更新时间 |
SourcePosition | string | 相对来源的位置,参考 Source 来源 |
AudioTexts | []AudioText | 音频转文字结果 |
AudioTextsStatus | string | 音频标签处理的状态 |
AudioTextsFailReason | string | 音频标签处理的失败原因 |
AudioTextsModifyTime | string | 音频标签处理的更新时间 |
AudioText
音频标签
Parameter | Type | Comment |
---|---|---|
Text | string | 文字 |
BeginTime | float | 开始时间 |
EndTime | float | 结束时间 |
SilenceDuration | float | 本句与上一句之间的静音时长,单位为秒 |
EmotionValue | float | 情绪能量值 |
ChannelId | int | 该句所属音轨ID |
SpeechRate | int | 平均语速,单位为每分钟字数 |
Confidence | float | 置信度 |
Person | string | 所属人员 |
Library | string | 识别类型 |
Image
列出图片详细的 JSON Object,其中具体字段意义如下
Parameter | Type | Comment |
---|---|---|
Project | string | Project |
SetId | string | SetId |
ImageUri | string | 图片 OSS Uri |
ImageWidth | int | 图片宽度 |
ImageHeight | int | 图片高度 |
ImageFormat | string | 图片格式,如 jpg |
Exif | string | 图片原始 EXIF 信息,以 JSON Object 序列化后的格式存储 |
FileSize | int | 文件大小 |
ImageTime | string | 图片拍摄日期,该日期从 EXIF 信息获取,若无 EXIF 信息则无该项 |
Orientation | string | 图片旋转值,从 EXIF 信息获取 |
Location | string | 地理位置,从 EXIF 信息获取,格式为 lat,long ,以逗号分隔的浮点数 |
SourceType | string | 来源类型,参考 Source 来源 |
SourceUri | string | 来源的 Uri,参考 Source 来源 |
SourcePosition | string | 相对来源的位置,参考 Source 来源 |
RemarksA | string | Remarks 标记信息 |
RemarksB | string | Remarks 标记信息 |
RemarksC | string | Remarks 标记信息 |
RemarksD | string | Remarks 标记信息 |
ExternalId | string | 外部 ID,用于和您的应用层的 ID (如果有)进行绑定 |
CreateTime | string | 图片加入 Set 的时间 |
ModifyTime | string | 图片在 Set 内被修改的时间 |
Tags | []Tag | 标签识别结果 参考 引擎结果四元组 |
TagsStatus | string | 标签识别的状态 |
TagsFailReason | string | 标签识别的失败原因 |
TagsModifyTime | string | 标签识别的更新时间 |
Faces | []Face | 人脸识别结果 |
FacesStatus | string | 人脸识别的状态 |
FacesFailReason | string | 人脸识别的失败原因 |
FacesModifyTime | string | 人脸识别的更新时间 |
OCR | []OCR | OCR识别结果 |
OCRStatus | string | OCR识别的状态 |
OCRFailReason | string | OCR识别的失败原因 |
OCRModifyTime | string | OCR识别的更新时间 |
Celebrity | []Celebrity | 名人识别结果 |
CelebrityStatus | string | 名人识别的状态 |
CelebrityFailReason | string | 名人识别的失败原因 |
CelebrityModifyTime | string | 名人识别的更新时间 |
Address | []Address | 照片地理位置检测结果 |
AddressStatus | string | 照片地理位置检测的状态 |
AddressFailReason | string | 照片地理位置检测的失败原因 |
AddressModifyTime | string | 照片地理位置检测的更新时间 |
Tag
标签信息。
Parameter | Type | Comment |
---|---|---|
TagName | string | 标签名称 |
TagLevel | int | 标签级别,1-4 |
TagConfidence | float | 标签置信度 |
ParentTagName | string | 父级标签名称 |
Face
人脸信息。
Parameter | Type | Comment |
---|---|---|
FaceId | string | 人脸唯一 ID |
FaceConfidence | float | 人脸置信度 |
FaceQuality | float | 人脸质量 |
Age | int | 年龄 |
Gender | enum | 性别,MALE / FEMALE |
GenderConfidence | float | 性别置信度 |
Emotion | string | 心情 HAPPY / SAD / ANGRY / SURPRISED / SCARED / DISGUSTED / CALM |
EmotionConfidence | float | 心情置信度 |
EmotionDetails | map[string]float | 七种心情对应的置信度 |
Attractive | float | 吸引力, 0~1 |
GroupId | string | 人脸分组 ID 。参考 人脸聚类功能 |
FaceAttributes | FaceAttributes | 人脸其他属性 |
FaceAttributes
人脸其他属性。
Parameter | Type | Comment |
---|---|---|
Beard | string | 胡子, NONE / BEARD |
BeardConfidence | float | 胡子置信度 |
Race | string | 种族, WHITE / YELLOW / BLACK |
RaceConfidence | float | 种族置信度 |
Mask | string | 面罩, NONE / MASK |
MaskConfidence | float | 面罩置信度 |
Glasses | string | 眼镜, NONE / GLASSES / SUNGLASSES |
GlassesConfidence | float | 眼镜置信度 |
FaceBoundary | Boundary | 人脸位置框 |
HeadPose | HeadPose | 头部朝向 |
HeadPose
头部朝向。取值范围均为 -180.0 ~ +180.0 ,单位为角度。在应用时,若值超过采信范围,则识别的准确性无法保证,在使用时建议忽略该人脸。
Parameter | Type | Comment |
---|---|---|
Roll | float | 面内偏转角,理论范围 -180 ~ +180 度,建议采信的范围是 -45 ~ +45 度。 |
Yaw | float | 人脸的左右偏转角,-180 ~ +180 度,建议采信的范围是 -80 ~ +80 度。 |
Pitch | float | 人脸的俯仰角,-180 ~ +180 度,建议采信的范围是 -30 ~ +30 度。 |
OCR
OCR 文字识别信息。
Parameter | Type | Comment |
---|---|---|
OCRContents | string | 文字内容 |
OCRConfidence | float | 文字置信度 |
OCRBoundary | Boundary | 文字位置框 |
Celebrity
名人检测信息。
Parameter | Type | Comment |
---|---|---|
CelebrityName | string | 姓名 |
CelebrityLibraryName | string | 分类 |
CelebrityConfidence | float | 人物置信度 |
CelebrityBoundary | Boundary | 人物位置框 |
Address
将 GPS 坐标 Location
转换为可读的地理信息的结果。
Parameter | Type | Comment |
---|---|---|
Country | string | 国家 / 地区 |
Province | string | 省(或同级) |
City | string | 城市(或同级) |
District | string | 区(或同级) |
Township | string | 街道(或同级) |
AddressLine | string | 完整地址 |
Boundary
位置框,单位为像素。
Parameter | Type | Comment |
---|---|---|
Left | int | 顶点 X 坐标,距离左端距离 |
Top | int | 顶点 Y 坐标,距离顶端距离 |
Width | int | 宽度 |
Height | int | 高度 |
引擎结果四元组
对图片、视频处理的结果,通常为如下四元组,以 Tags 标签识别为例
- Tags:
标签识别结果,该元素是引擎处理后的结果信息,根据引擎功能不同而不同。
- TagsStatus:
标签识别的状态,该元素是引擎运行的状态。可能值为:NotProcessed / Processing / Success / Failed 。分别表明未处理、处理中、成功、失败。使用者可以根据该状态标记位,决定读取结果、等待或重试。
- TagsFailReason:
标签识别的失败原因。该元素是引擎的错误原因。当 XXXStatus 为 Failed 时,该值不为空。格式为
[400 InvalidResource] Specified resource is too large. Please check.
即
[HTTPStatusCode ErrorCode] ErrorMessage
当 HTTPStatusCode > 500 时,您可以提交 Ticket 给 IMM 处理。
- TagsModifyTime
标签识别的更新时间。该元素是引擎操作的更新时间,当 TagsStatus 更改时更新。
Source 来源
一个 Set 内可以保存各种类型的媒体文件。有些媒体文件是其他媒体文件生成的。如视频在 IndexVideo 后,截取的帧图片也会存在相同的 Set 内。此时,可以通过 Source 相关参数来获知媒体文件之间的关系。
- SourceType
来源的文件类型,目前可以为 video
和 image
。使用 IndexImage 索引图片时,该图片的 SourceType
即为 image
。而使用 IndexVideo 索引视频时,视频截取的帧图片的 SourceType
即为 video
。
- SourceUri
来源文件的 URI 。对于 IndexImage 索引的图片, SourceUri 和 ImageUri 是相同的。而 IndexVideo 索引视频产生的帧图片,SourceUri 为对应视频的 VideoUri 。
- SourcePosition
相对来源文件的位置。
目前仅当图片的来源 SourceType
为 video
时,该字段定义为该图片帧处于源视频的时间轴位置。格式为 "00000000.010"
,即 %8.3f
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。
评论