VisualGLM-6B icon indicating copy to clipboard operation
VisualGLM-6B copied to clipboard

通过微调可以使模型拥有基本的中文OCR能力吗?

Open JustWB13 opened this issue 2 years ago • 2 comments

比如准备一些包含中文的图片, 用这些图片对模型进行微调后得到的模型会具有中文OCR能力吗?

JustWB13 avatar May 23 '23 06:05 JustWB13

主要是clip训练的时候没中文,所以如果想拥有中文且不损失原有能力还是挺难的。我们下个版本应该会考虑这个问题,但是这个版本如果要增加的话,我猜测有难度,但是也不确定。

Sleepychord avatar May 23 '23 14:05 Sleepychord

用的不是blip2嘛,为啥说是clip训练?求解答~

yysirs avatar Jun 17 '23 11:06 yysirs

用的不是blip2嘛,为啥说是clip训练?求解答~

BLIP2的VIT端是fixed住的,CLIP训练出来的权重

xiaoxin83121 avatar Jun 25 '23 07:06 xiaoxin83121

主要是clip训练的时候没中文,所以如果想拥有中文且不损失原有能力还是挺难的。我们下个版本应该会考虑这个问题,但是这个版本如果要增加的话,我猜测有难度,但是也不确定。

想问下,这个版本要增加的话,能介绍下主要的思路嘛?感谢~

xiaoxin83121 avatar Jun 25 '23 07:06 xiaoxin83121

主要是clip训练的时候没中文,所以如果想拥有中文且不损失原有能力还是挺难的。我们下个版本应该会考虑这个问题,但是这个版本如果要增加的话,我猜测有难度,但是也不确定。

您好,这个clip训练是指的对齐之后的微调吗,我看readme里有介绍,训练BLIP2的时候是有用到中文数据的

yuanlisky avatar Aug 15 '23 08:08 yuanlisky

主要是clip训练的时候没中文,所以如果想拥有中文且不损失原有能力还是挺难的。我们下个版本应该会考虑这个问题,但是这个版本如果要增加的话,我猜测有难度,但是也不确定。

所以下个版本有时间点吗,谢谢

aisensiy avatar Aug 21 '23 05:08 aisensiy

类似DONUT这种OCR-FREE的方法吗

SLTK1 avatar Aug 22 '23 02:08 SLTK1