20011--Image-Caption-Data-Of-OCR-In-Natural-Scenes

Description

20,000 Image Caption Data Of OCR In Natural Scenes, including Asian and European languages, a total of 14 languages, the collection environment includes shop plaques, stop signs, posters, road signs and other scenes, including a variety of shooting angles. The description language is English, which mainly describes the text arrangement, text content, color and other information.

For more details, please refer to the link: https://www.nexdata.ai/datasets/llm/1288?source=Github

Data size

20,000 pictures, 20,000 descriptions

Language distribution

Asian languages: Korean, Indonesian, Malay, Vietnamese, Thai, Chinese, Japanese European languages: French, German, Italian, Portuguese, Russian, Spanish, English

Collection environment

including store plaques, stop signs, posters, road signs, prompts and other scenes

Collection diversity

including 14 languages, various natural scenes, and multiple shooting angles

Data format

image format is .jpg, text format is .txt

Collection equipment

mobile phone, camera

Description language

English

Text length

in principle, 30~60 words, usually 3-5 sentences

Main description content

text arrangement, text content, color, scene

Main deAccuracy ratescription content

the proportion of correctly labeled images is not less than 97%

Licensing Information

Commercial License

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
README.md		README.md
图片10.png		图片10.png
图片6.png		图片6.png
图片7.png		图片7.png
图片8.png		图片8.png
图片9.png		图片9.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

20011--Image-Caption-Data-Of-OCR-In-Natural-Scenes

Description

Data size

Language distribution

Collection environment

Collection diversity

Data format

Collection equipment

Description language

Text length

Main description content

Main deAccuracy ratescription content

Licensing Information

About

Releases

Packages

Nexdata-AI/20011--Image-Caption-Data-Of-OCR-In-Natural-Scenes

Folders and files

Latest commit

History

Repository files navigation

20011--Image-Caption-Data-Of-OCR-In-Natural-Scenes

Description

Data size

Language distribution

Collection environment

Collection diversity

Data format

Collection equipment

Description language

Text length

Main description content

Main deAccuracy ratescription content

Licensing Information

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages