Naber

gImageReader – Linux'ta Görüntülerden ve PDF'lerden Metin Çıkarın

Anonim

gImageReader, resimlerden ve PDF'lerden metin çıkarma yeteneğine sahip ücretsiz ve açık kaynaklı bir PDF okuyucusudur. Tesseract-OCR için basit bir Gtk/Qt ön ucu olarak oluşturulmuştur, belgelerdeki ve görüntülerdeki metinleri ve kalıplarıkullanarak tanımak için açık kaynaklı bir OCR motorudur. Yapay zeka

Tek başına Tesseract, terminallerine yeterince aşina olan Linux kullanıcılarının kullanımıyla sınırlandırılmış bir komut satırı aracıdır. gImageReader sayesinde artık herkes motorun OCR verimliliğinden faydalanabilir.

gImageReader, Unicode karakterlerin varlığı sayesinde desteklediği çeşitli dillerden herhangi birinde PDF veya resim dosyasındaki metinleri tarayarak çalışır . Yazım denetimi ve çeviri görevlerini gerçekleştirebileceğiniz basit, iyi organize edilmiş, özelleştirilebilir bir kullanıcı arabirimine sahiptir.

gImageReader'daki Özellikler

gImageReader'ın kullanımı kolaydır ve elektronik kopya belgelerle ve yüklenen medyanın anlık görüntüleriyle çalışmayı destekler; Ekran görüntüleri. İlgilendiğiniz metin alanını ve yalnızca ihtiyacınız olan metni seçme seçeneğiniz bile var. Sonuç olarak, gImagereader hem PDF okuyucu hem de metin çıkarma aracı olarak işlev görür. Saçma şeyler.

Linux'ta gImageReader'ı kurun

gImageReader'ı sonuna kadar kullanmak için Tesseract'ı manuel olarak kurmalısınız. Görüntüleri ve dosyaları düzgün bir şekilde analiz edebilmeniz için dil paketi.Paketin adı 'Tesseract-ocr-eng' ve yazılım yöneticisinden Debianve Fedora dağıtımlar.

Ubuntu çalıştırıyorsanız, basitçe PPA ekleyebilirsiniz.ve aşağıdaki komutları kullanarak yükleme komutunu çalıştırın:

$ sudo add-apt-repository ppa:sandromani/gimagereader
$ sudo uygun güncelleme
$ sudo apt gimagereader'ı kurun

Açık Debian, Fedora, ve OpenSUSE paket yöneticisinden yükleyin.

$ sudo apt gimagereader'ı kurun
$ sudo dnf gimagereader'ı kurun
$ sudo zypper gimagereader'ı kurun

Arch Linux veya türevlerinden herhangi birini çalıştırıyorsanız kendinizi dışlanmış hissetmeyin. AUR sizi korudu. Uygulamayı kaynaktan yeniden oluşturmayı tercih ederseniz, talimatlar GitHub deposu Wiki bağlantısındadır.

Görüntülerden basılı metin çıkaran siz misiniz? Hatta telefonunuzla seçili alanların anlık görüntülerini alabilir ve bunları dizüstü bilgisayarınıza yükleyebilirsiniz. Daha da güzeli, mükemmel olmasa da şu anda topluluktaki en iyi seçeneklerden biri olan çoklu dil desteği.

gImageReader, özellikle OCR özelliği ile açık kaynak dünyasının en iyi PDF okuyucuları arasındadır, bu yüzden bir deneyin ve hemen görün nasıl seversin.

Her zamanki gibi, varsa uygulamayla ilgili deneyimlerinizi bizimle paylaşabilirsiniz. Ve aşağıdaki yorumlar bölümüne başka öneriler eklemek için.