在遇到大型数据库时,从中选取一个子集先行训练往往是一个比较好的选择。代码如下:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19import json
import os
imgpath='/data2/guoyu/subset/'
labeljsonpath='/data2/guoyu/keypoint_validation_annotations_20170911.json'
f=open(labeljsonpath)
label=json.load(f)
subsetlist=os.listdir(imgpath)
jsonTosave='/data2/guoyu/subset.json'
jFile=open(jsonTosave,'w')
ls=[]
for x in range(len(subsetlist)):
imgid=subsetlist[x][:-4]
for lab in label:
if lab["image_id"]==imgid:
di={}
di=lab
ls.append(di)
json.dump(ls,jFile)
jFile.close()
根据文件名从json文件中提取信息
相关文章