Bạn có một đoạn text bằng tiếng Trung, muốn mang nó lên google translator để dịch sang tiếng Việt nhằm một mục đích nào đó. Nhưng nếu đoạn text đó nằm trong file hình ảnh không thể copy vào google translator, và bạn lại không hề biết tí gì về tiếng Trung, lại càng không biết cách gõ vào máy tính như thế nào cả, thế thì phải làm sao? 8-x Đến lúc này bạn sẽ nghĩ ngay đến việc tìm một phần mềm có khả năng nhận diện được những dòng chữ loằng ngoằng kia và xuất ra thành chữ mà có thể copy mang vào google translator được. Phương pháp này được gọi chung là OCR (Optical Character Recognition).
Lên mạng tìm sẽ có khá nhiều phần mềm làm được việc này, tuy nhiên hầu hết kết quả lại không như mong đợi: Có chữ nhận diện được, có chữ thì không, lại còn cho ra những chữ khác xa hoàn toàn so với chữ gốc nữa 8-x.
Ngoài ra còn có một số phần mềm nhận diện chữ bằng cách vẽ từng nét chữ, nhưng cách này thì lâu cực kì và rất mất thời gian 8-x.
Do đó mình xin giới thiệu một phần mềm nhận diện chữ với độ chính xác cao, mình đang dùng nó và thấy khá hài lòng, thi thoảng nó cũng không nhận diện được một số chữ nhưng mình lại có mẹo để nó vẫn nhận diện được. Phần mềm này rất có thể trong máy bạn có cài đặt rồi nhưng lại chưa hề dùng đến :-?.
Do đó mình xin giới thiệu một phần mềm nhận diện chữ với độ chính xác cao, mình đang dùng nó và thấy khá hài lòng, thi thoảng nó cũng không nhận diện được một số chữ nhưng mình lại có mẹo để nó vẫn nhận diện được. Phần mềm này rất có thể trong máy bạn có cài đặt rồi nhưng lại chưa hề dùng đến :-?.
Cái mình đang nói đến chính là Microsoft OneNote, nằm trong bộ Office của Microsoft. Hiện tại mình đang dùng bản Microsoft OneNote 2010, cài đặt từ bộ Microsoft Office 2010 Professional Plus. Bản mình cài là bản tiếng Anh, mặc định chỉ hỗ trợ nhận diện chữ của 3 ngôn ngữ là English, French, và Spanish. Do đó để có thể nhận diện được chữ Trung Quốc cần cài đặt thêm gói ngôn ngữ tiếng Trung, và hầu hết chữ Trung Quốc được sử dụng hiện nay là chữ giản thể (Simplified), do đó chỉ cần cài thêm gói ngôn ngữ Chinese Simple thôi.
Link download thì google search X16-37690.exe (nếu office đã cài là bản 32bit) hoặc X16-37627.exe (nếu là bản 64bit). Lưu ý đây là gói ngôn ngữ cho office 2010 nhé.
Còn đối với office 2013 sẽ là X18-51518.exe (nếu office đã cài là bản 32bit) hoặc X18-51519.exe (nếu là bản 64bit).
Sau khi cài đặt xong gói ngôn ngữ cần thiết, nên khởi động lại máy để có hiệu lực.
Mở Microsoft OneNote 2010 lên, để ý sau đó sẽ có 1 icon của OneNote chạy thường trực bên dưới khay đồng hồ, cái này rất tiện là khi nào cần đưa 1 phần hình ảnh (có chữ Trung Quốc) vào trong OneNote thì nhấn tổ hợp phím Windows + S, chọn vùng cần lấy, sau đó sẽ xuất hiện 1 bảng, chọn lưu vào clipboard (đánh dấu tick vào ô lưu lại tùy chọn để sau này nó không hỏi lại nữa), sau đó chuyển sang cửa sổ OneNote và paste vào (Ctrl + V), rất nhanh.
Để nhận diện chữ Trung Quốc thì ở cửa sổ OneNote, nhấn phải chuột vào hình (hình mà khi nãy mới paste vào ấy), chọn cái cuối cùng là Make Text in Image Searchable > Chinese (PRC) (nên để default language thành Trung Quốc thì mỗi lần làm khỏi phải chọn lại, đỡ mất thời gian, còn giao diện thì vẫn là giao diện tiếng Anh, không bị ảnh hưởng gì cả). Để lấy được chữ thì nhấn phải chuột vào hình rồi chọn cái ở gần cuối là Edit Alt Text... (thực ra chọn Copy Text from Picture cũng được, nhưng chọn cái kia để còn kiểm tra xem nó nhận diện đúng hay sai, rồi copy chữ ngay trong ô đó luôn).
Một số chữ (nhất là những chữ nằm riêng lẻ hoặc cách nhau không đều, hoặc chỉ nằm trên một dòng duy nhất) nó không nhận diện ngay được, không xuất ra được chữ gì hoặc là nhận diện sai chữ. Hãy thử chọn lại vùng nhỏ hơn và gần sát chữ hơn. Nếu vẫn không nhận diện được thì có một mẹo, hơi vất vả tí nhưng bù lại sẽ lấy được chữ cần lấy, đó là đưa cái hình kia vào mspaint, crop dòng chứa chữ không nhận diện được, sau đó copy và paste hình đó và đặt xuống bên dưới, coi như là thành 2 dòng giống nhau, làm cỡ 4-5 dòng (khoảng cách đều nhau) là sẽ trông như 1 đoạn văn mà các dòng có cùng nội dung.
Một số trường hợp chữ trong hình nằm trên nền ảnh, gây khó khăn cho việc nhận diện chữ, lúc này mang vào photoshop, để nền màu đen, rồi dùng eraser xóa sao cho chỉ còn chữ trên nền đen. Hơi vất vả nhưng vì mù tiếng Trung nên đành chịu thôi :D.
Hình ví dụ đây, nãy giờ toàn chữ là chữ, thấy cũng kì (cái hình mình lấy từ clip phim hoạt hình ra, chất lượng của phim đó rất tệ, hình thì mờ, res chỉ có 240p thôi):

Còn đối với office 2013 sẽ là X18-51518.exe (nếu office đã cài là bản 32bit) hoặc X18-51519.exe (nếu là bản 64bit).
Sau khi cài đặt xong gói ngôn ngữ cần thiết, nên khởi động lại máy để có hiệu lực.
Mở Microsoft OneNote 2010 lên, để ý sau đó sẽ có 1 icon của OneNote chạy thường trực bên dưới khay đồng hồ, cái này rất tiện là khi nào cần đưa 1 phần hình ảnh (có chữ Trung Quốc) vào trong OneNote thì nhấn tổ hợp phím Windows + S, chọn vùng cần lấy, sau đó sẽ xuất hiện 1 bảng, chọn lưu vào clipboard (đánh dấu tick vào ô lưu lại tùy chọn để sau này nó không hỏi lại nữa), sau đó chuyển sang cửa sổ OneNote và paste vào (Ctrl + V), rất nhanh.
Để nhận diện chữ Trung Quốc thì ở cửa sổ OneNote, nhấn phải chuột vào hình (hình mà khi nãy mới paste vào ấy), chọn cái cuối cùng là Make Text in Image Searchable > Chinese (PRC) (nên để default language thành Trung Quốc thì mỗi lần làm khỏi phải chọn lại, đỡ mất thời gian, còn giao diện thì vẫn là giao diện tiếng Anh, không bị ảnh hưởng gì cả). Để lấy được chữ thì nhấn phải chuột vào hình rồi chọn cái ở gần cuối là Edit Alt Text... (thực ra chọn Copy Text from Picture cũng được, nhưng chọn cái kia để còn kiểm tra xem nó nhận diện đúng hay sai, rồi copy chữ ngay trong ô đó luôn).
Một số chữ (nhất là những chữ nằm riêng lẻ hoặc cách nhau không đều, hoặc chỉ nằm trên một dòng duy nhất) nó không nhận diện ngay được, không xuất ra được chữ gì hoặc là nhận diện sai chữ. Hãy thử chọn lại vùng nhỏ hơn và gần sát chữ hơn. Nếu vẫn không nhận diện được thì có một mẹo, hơi vất vả tí nhưng bù lại sẽ lấy được chữ cần lấy, đó là đưa cái hình kia vào mspaint, crop dòng chứa chữ không nhận diện được, sau đó copy và paste hình đó và đặt xuống bên dưới, coi như là thành 2 dòng giống nhau, làm cỡ 4-5 dòng (khoảng cách đều nhau) là sẽ trông như 1 đoạn văn mà các dòng có cùng nội dung.
Một số trường hợp chữ trong hình nằm trên nền ảnh, gây khó khăn cho việc nhận diện chữ, lúc này mang vào photoshop, để nền màu đen, rồi dùng eraser xóa sao cho chỉ còn chữ trên nền đen. Hơi vất vả nhưng vì mù tiếng Trung nên đành chịu thôi :D.
Hình ví dụ đây, nãy giờ toàn chữ là chữ, thấy cũng kì (cái hình mình lấy từ clip phim hoạt hình ra, chất lượng của phim đó rất tệ, hình thì mờ, res chỉ có 240p thôi):

cho mình hỏi nếu dùng office 2k7 thì phải down gói ngôn ngữ ở đâu vậy?
ReplyDeleteBạn tìm X12-34004.exe nhé.
DeleteThank bạn, mình down & cài được rồi. Nhưng sao sau khi cài xong thì khi chọn Make Text in Image Searchable vẫn không có mục Chinese (PRC) vậy?
DeleteBạn khởi động lại máy thử xem? Nếu vẫn không thấy thì chắc gói proofing tools nó nằm ngoài chứ không nằm chung với language packs như office 2010.
DeleteBạn cài thêm cái này nhé (cái language packs vẫn để đó đừng tháo ra, vì nó như cái thư viện để lấy nguồn vậy đó):
http://www.microsoft.com/zh-cn/download/details.aspx?id=27830
Nhấn vào nút màu đỏ (下载) để download. Chỉ cần cài Service Pack 3 (SP3) thôi vì nó đã bao gồm SP1 và SP2 rồi.
Cho bạn hỏi, máy bạn dùng Win7 với Office 2007. Mình theo hướng dẫn của bạn chỉ có bạn ở trên thì lúc làm xong nó lại thành ra thế này : http://i1329.photobucket.com/albums/w552/rookie_girl2310/Untitled_zpsafc0ebfa.png
ReplyDeleteNếu ko chọn disable thì mục Chinese lại ko hiện ra.
Mong bạn chỉ dùm mình.
Cảm ơn.
Nó bị vậy rất có thể là do bạn chưa cài language packs. Bạn tìm X12-34004.exe và cài xem. Nếu bạn đã cài rồi mà nó vẫn bị vậy thì bạn thử thế này: Trong OneNote, nhấn vào logo office ở góc trên bên trái > chọn OneNote Options (nằm ở dưới cùng của hàng bên phải) > ở bảng mới xuất hiện chọn Advanced > kéo xuống giữa xem có cái "Disable text recognition in pictures" không, nếu có thì xóa dấu tick ở đó đi.
DeleteCòn 1 vấn đề nữa, có thể office của bạn đã nâng cấp lên SP1 (hoặc SP2, SP3), mặc định bộ cài chỉ hỗ trợ 3 ngôn ngữ, còn Chinese là mới cài vào thêm (language packs ở trên chỉ mới áp dụng cho mấy phần tử cũ chứ chưa áp dụng cho mấy service pack này), nên phải update cả cái language theo. Bạn thử xem office của bạn là SP1 hay SP2, SP3 (xem bằng cách mở Microsoft Word lên > nhấn vào logo office > chọn Word Options > ở bảng mới xuất hiện chọn Resources > nhấn About), sau đó cần cài thêm update tương ứng:
- SP1: http://www.microsoft.com/zh-cn/download/details.aspx?id=3770
- SP2: http://www.microsoft.com/zh-cn/download/details.aspx?id=5
- SP3: http://www.microsoft.com/zh-cn/download/details.aspx?id=27838
P/s: Cái Office 2007 lằng nhằng nhờ? ._.
mình làm được hầu hết các bước mà bạn chỉ dẫn vào trong onenote cũng đã có dòng dịch sag tiếng trung mà lúc mình bấm Edit Alt Text... vào tấm hình đó thì nó lại ko dịch được gì cả bạn à =="
DeleteBạn đã nhấn phải chuột vào tấm hình rồi chọn Make Text in Image Searchable > Chinese (PRC) chưa?
DeleteNếu đã làm đúng các bước mà lại không xuất ra được chữ gì thì ở trên mình cũng có lưu ý và có mẹo khắc phục đó: "Một số chữ (nhất là những chữ nằm riêng lẻ hoặc cách nhau không đều, hoặc chỉ nằm trên một dòng duy nhất) nó không nhận diện ngay được, không xuất ra được chữ gì hoặc là nhận diện sai chữ".
Với những chữ là captcha thì sẽ khó nhận diện hơn, chữ bị cố tình làm mờ đi để chỉ con người mới đọc được, lúc đó đành phải tìm cách tô lại mấy cái chữ bị mờ đó thì mới có kết quả.
Cho mình xin X16-37690.exe cho Microsoft OneNote 2010 với bạn. Link chết hết rồi
ReplyDeleteMail: tyvacun@gmail.com
Hoặc nguyentrungthanh84@gmail.com
À, file X16-37690.exe là dành cho Office 2010 bản 32bit nha bạn.
DeleteĐã gửi vào mail thứ nhất của bạn.
cho mình xin link download X16-37690.exe với bạn.
Deletemail:hoangthanh0501@gmail.com
Đã gửi cho bạn rồi nhé!
Deletecho mình xin file X16-37690.exe với
Deletemail: blackholeck3z@gmail.com
chào anh, cho mình xin link của X18-51518.exe.
Deletemình tìm không còn.
taquanghuy2001@yahoo.com/
Cảm ơn
Bạn Thành Nguyễn cho mình xin X16-37690.exe với nhé?
Deleteemail: lovelymokona@yahoo.com
Cảm ơn bạn nhiều!
cho mình xin file X18-51519.exe với
Deletegiomuadong181@gmail.com
link donw file X16-37690.exe bị die hết rồi, bạn có thể gửi file đó cho mình được ko?
ReplyDeleteMail mình là sesskakashi@gmail.com
Thank bạn nhiều.
Đã gửi, bạn check mail nhé.
Deletebạn có thể gửi cho mình link tải file X12-34004.exe được ko, mail của mình là phucddcm7749@gmail.com. cảm ơn bạn rất nhiều.
ReplyDeleteMình không còn giữ file này nữa bạn ạ, tiếc quá.
Deleteoh vậy à, tiếc thật, dù sao cũng thanks bạn vì bài viết bổ ích.
Deletebác nào còn link X16-37627.exe cho mình xin với. thanks
Deleteemail watamela@gmail.com
Trên mạng có mirror link file X16-37627.exe mà bác.
DeleteĐã gửi link vào email của bác.
thanks bác em nhận được mail rùi, các link trên mạng toàn bị lỗi mình ko download được
DeleteAD ơi mình xài offer 2013 cho mình xin file của 2013 với
ReplyDeleteMail: ducnguyenthanhqn@gmail.com
Mình tìm thì thấy trước đây nó cho download, còn giờ nó bắt phải mua bạn ạ. Trên mạng cũng có mirror links đó. Đã gửi links vào email của bạn.
Delete- Bản 32bit là X18-51518.exe
- Bản 64bit là X18-51519.exe
Hai cái trên là gói ngôn ngữ.
Còn đây là bản cập nhật SP1 cho gói ngôn ngữ (nếu đã update lên SP1):
-Bản 32bit:
http://www.microsoft.com/zh-CN/download/details.aspx?id=41999
-Bản 64bit:
http://www.microsoft.com/zh-CN/download/details.aspx?id=42000
Và gói proofing tools:
http://www.microsoft.com/zh-CN/download/details.aspx?id=35400
Cho mình xin gói tiếng trung cho Office 2013 (32bit) với, cảm ơn bạn!
DeleteCho mình xin gói ngôn ngữ prc của one not 2013 nha bạn
ReplyDeleteuthingheo@gmail.com
cảm ơn
Đã gửi links vào email của bạn.
DeleteCho mình xin X18-51518.exe và X18-51519.exe cho Microsoft OneNote 2013 bản 32 và bản 64 bit với bạn. Link chết hết rồi
ReplyDeleteMail: tyvacun@gmail.com
Hoặc nguyentrungthanh84@gmail.com
Bạn ơi, mình dùng Microsoft Word 2010, cho mình xin link down 64bit với.
ReplyDeleteMail: bachdoncac@gmail.com
Có cách nào nhận biết chính xác ngôn ngữ tiếng anh trong hình không bạn?
ReplyDeleteNếu có cho minh xin nha CaoHanh
Email: tyvacun@gmail.com
Hoặc nguyentrungthanh84@gmail.com
Bác nào còn phần mềm không gửi vào mail cho em với minhtam5186@gmail.com mấy link serch trên google toàn bắt mua bản quyền thôi, đội ơn các bác nhiều
ReplyDeleteBạn ơi cho mình xin file X16-37690.exe và cả X16-37627.exe nha. Thanks bạn nhiều!
ReplyDeleteEmail của mình: goodjob01234@gmail.com. cảm ơn bạn.
Source cho toàn bộ Office:
ReplyDeletehttps://sites.google.com/site/shaisoftware1/home/office-2013
cho mình hỏi cái này có trên windowsphone k ạ
ReplyDeleteCho mình xin X16-37627.exe và X18-51519.exe qua Gmail: nguyenthanhtriduc@gmail.com
ReplyDeletemình tìm trên gg thì link toàn die của 2013 thì bắt phải mua
bạn ơi cho mình xin link down X18-51519.exe với TToTT kiếm hoài toàn link die với bắt mua 2 chiệu, xiền đâu mà mua TToTT mail mình là : hothienha3@gmail.com. Cảm ơn bạn nhiều
ReplyDeletebạn ơi cho mình link downd vào mail scorpio.kuz@gmai.com với. đau khổ vì k tải đc
ReplyDeleteAd ơi cho mình xin file X16-37690.exe trên mạng không có link dow, thank!
ReplyDeletethuongmmo87@gmail.com
bạn ơi cho xin bản office 2013 sẽ là X18-51518.exe với mail là fusion1992@gmail.com
ReplyDeleteBạn ơi cho mình xin file X16-37690.exe nha, trên mạng link down die hết rồi. Email của mình là one.piece.my.999@gmail.com. Cảm ơn bạn nhiều và hi vọng bạn sẽ giúp đỡ
ReplyDeleteĐã gửi. Bạn check email nhé!
Deletecaohanh1502 cho mình xin số đt liên hệ vào mail duyetmau@gmail.com hoặc nt vào số 0983827037 mình cần bạn cài hoàn chỉnh cho mình mấy máy tính có phí ạ. thanhk bạn
DeleteBạn cho mình xin bản X18-51518.exe cho Office 2013 với ạ. Mail mình là maidienvi2803@gmail.com. Cám ơn bạn!
ReplyDeleteC ơi, c có thể gửi cho e link down X18-51518.exe đc ko ạ? mail e là julia1409love@gmail.com. e c.on c trc ạ.
ReplyDeleteThis comment has been removed by the author.
ReplyDeleteAnh ơi, anh có thể gửi cho em X16-37690.exe và X12-34004.exe được không? link die hết rồi. Gio toàn bắt phải mua thôi. Mail em: moviedat2@gmail.com .Cảm ơn anh trước nhé
ReplyDeletecaohanh1502 cho mình xin số nhé. 0983827037
ReplyDeleteChị ơi, em lên gg tìm mà không có download được X16-37627.exe nó cứ bắt nhập email rồi cái gì mà mua này nọ ấy TT^TT chị có thể giúp em không ạ? mail của em nga11cdbk@gmail.com
ReplyDeleteBạn cho mình xin bản X18-51520.exe cho Office 2013 với ạ. Link die hết rồi. Mail mình là nguyenxuantuan07@gmail.com. Cám ơn bạn trước nhé và hi vọng bạn sẽ giúp đỡ!
ReplyDeleteAdd ơi cho mình xin file X18-51519.exe với
ReplyDeletegiomuadong181@gmail.com
ad ơi, cho mình xin file X16-37690.exe được không ạ
ReplyDeletead ơi, cho mình xin file X16-37690.exe được không ạ
ReplyDeleteCho mình xin file X16-37690.exe với ad ơi,
ReplyDeletemail mình taichinhketoanbhhc@gmail.com thanks ad nhiều./
Cho mình link down với bạn ơi.
ReplyDeleteEmail:kimthao1901@gmail.com
Cho mình link down X16-37627.exe với bạn ơi.
ReplyDeleteEmail: yurikowatanabe18012005@gmail.com
https://drive.google.com/open?id=0BwpKkl9bFQkZSWZfTXN4LU9ReUE
DeleteCác bạn download ở đây này
ReplyDeletehttps://www.youtube.com/watch?v=eN9YVQ8jT9Y