Pdf Kelime Arama Sorunu

ejderkulesi37

Öğrenci
Katılım
5 Haziran 2020
Mesajlar
11
Reaksiyon puanı
12
Puanları
3
Yaş
24
Merhabalar elimde bir kitabın pdf'si var. Pdf tamamen Türkçe şekilde görünüyor fakat bir kelime aramaya çalıştığımda hiç bir şekilde bulunmuyor. Metinde bir iki kelime işaretleyip sağ tık yapınca .DPXDLJKHG şeklinde ana metin görünüyor sanırım. Yani metinin ana dili farklı olduğu için Türkçe kelime araması yapamıyorum. Bu sorunun çözümü nedir yarın final sınavım var yardımcı olabilir misiniz? Çıkan ana metini ek olarak ekliyorum.

cache-v2
SORUN
 

bilexsamet

Müdavim
Müdavim
Katılım
18 Aralık 2013
Mesajlar
3,145
Reaksiyon puanı
2,415
Puanları
358
O belge önceden belki resim, belki arama yapılamayan bir PDF veya TIF dosyası iken sanırım birisi o belgeyi aranabilir PDF'e çevirmiş. Yani OCR ile aranabilir PDF yapılmış ama program iyi OCR yapamamış anlaşılan.

Aranabilir PDF'lerde görüntü bir resim iken seçtiğiniz kelimenin altında OCR yapılmış (yani resimden karaktere çevrilmiş) bir metin vardır.
Mesaj otomatik birleştirildi:

Belge kaç sayfa?
 

ejderkulesi37

Öğrenci
Katılım
5 Haziran 2020
Mesajlar
11
Reaksiyon puanı
12
Puanları
3
Yaş
24
O belge önceden belki resim, belki arama yapılamayan bir PDF veya TIF dosyası iken sanırım birisi o belgeyi aranabilir PDF'e çevirmiş. Yani OCR ile aranabilir PDF yapılmış ama program iyi OCR yapamamış anlaşılan.

Aranabilir PDF'lerde görüntü bir resim iken seçtiğiniz kelimenin altında OCR yapılmış (yani resimden karaktere çevrilmiş) bir metin vardır.
Mesaj otomatik birleştirildi:

Belge kaç sayfa?
bir çözümü var mı peki hocam Türkçe arama yapabilmem için ?
 

bilexsamet

Müdavim
Müdavim
Katılım
18 Aralık 2013
Mesajlar
3,145
Reaksiyon puanı
2,415
Puanları
358
Eğer görüntü çözünürlüğü yüksek ise ABBYY FineReader programı ile tekrar OCR yapmayı deneyebilirsiniz.

ABBYY Fine Reader, Türkçe karakterli belge ve resimleri çok iyi OCR yapıyor. Yani resmi metne çeviriyor. Online OCR yapan siteler de var ama ne ölçüde iyi çeviri bilemem.

Sizin mecburen o belgeyi tekrar OCR yapmanız gerekiyor. Çünkü eski OCR tam bir fiyaskoymuş. Yaptığı OCR'nin yazılı metin ile alakası yok.

Ama OCR sağlıklı bir yöntem değil. Onu belirteyim. Çünkü OCR'de bildiğiniz resimdeki yazıyı kopyalabilecek bir karakterlere çeviriyor. Mesela metindeki "s" harfinin altına bakımdan kaynaklı küçük bir mürekkep gelmiştir ve program onu "ş" olarak OCR yapabilir. Veya çözünürlük düşükse veya sayfa yamuksa bazı harfleri başka bir harf olarak algılayabilir.
 
Son düzenleme:

ejderkulesi37

Öğrenci
Katılım
5 Haziran 2020
Mesajlar
11
Reaksiyon puanı
12
Puanları
3
Yaş
24
Eğer görüntü çözünürlüğü yüksek ise ABBYY FineReader programı tekrar OCR yapmayı deneyebilirsiniz.

ABBYY Fine Reader, Türkçe karakterli belge ve resimleri çok iyi OCR yapıyor. Yani resmi metne çeviriyor. Online OCR yapan siteler de var ama ne ölçüde yi çeviri bilemem.

Sizin mecburen o belgeyi tekrar OCR yapmanız gerekiyor. Çünkü eski OCR tam bir fiyaskoymuş. Yaptığı OCR'nin yazılı metin ile alakası yok.

Ama OCR sağlıklı bir yöntem değil. Onu belirteyim. Çünkü OCR'de bildiğiniz resmdeki yazıyı kopyalabilecek bir karakterlere çeviriyor. Mesela metindeki "s" harfinin altına bakımdan kaynaklı küçük bir mürekkep gelmiştir ve program onu "ş" olarak OCR yapabilir. Veya çözünürlük düşükse veya sayfa yamuksa bazı harfleri başka bir harf olarak algılayabilir.
İlgi ve alakanız için teşekkür ederim, fakat şuan elimdeki pdf resim formatında değil metin formatında yine de söylediğiniz program işe yarar mı ?
 

"Melih"

Müdavim
Müdavim
Katılım
21 Temmuz 2019
Mesajlar
3,025
Reaksiyon puanı
1,915
Puanları
358
Microsoft store dll yazınız orda çikabilir.
Merhabalar elimde bir kitabın pdf'si var. Pdf tamamen Türkçe şekilde görünüyor fakat bir kelime aramaya çalıştığımda hiç bir şekilde bulunmuyor. Metinde bir iki kelime işaretleyip sağ tık yapınca .DPXDLJKHG şeklinde ana metin görünüyor sanırım. Yani metinin ana dili farklı olduğu için Türkçe kelime araması yapamıyorum. Bu sorunun çözümü nedir yarın final sınavım var yardımcı olabilir misiniz? Çıkan ana metini ek olarak ekliyorum.

cache-v2
SORUN
 

bilexsamet

Müdavim
Müdavim
Katılım
18 Aralık 2013
Mesajlar
3,145
Reaksiyon puanı
2,415
Puanları
358
Belge özel değilse, özel mesaj yoluyla bana gönderebilir misiniz? Bakabilir miyim?
 

bilexsamet

Müdavim
Müdavim
Katılım
18 Aralık 2013
Mesajlar
3,145
Reaksiyon puanı
2,415
Puanları
358
Belge taratılmış bir şey değil ama belgeyi hazırlayan metin olarak kopyalanmasını engellemek için böyle bir şey yapmış sanırım.
 

bilexsamet

Müdavim
Müdavim
Katılım
18 Aralık 2013
Mesajlar
3,145
Reaksiyon puanı
2,415
Puanları
358
Bence belgeyi OCR yapmayı deneyin.
Aranabilir PDF'i OCR yapmayı hiç denemedim ama ilk birkaç sayfasını OCR yapıp deneyin. Olursa tamamını yaparsınız.
Belgenin çözünürlüğü çok iyi. İyi bir OCR sonucu çıkar. Yani az hata ile.
 

ejderkulesi37

Öğrenci
Katılım
5 Haziran 2020
Mesajlar
11
Reaksiyon puanı
12
Puanları
3
Yaş
24
Bence belgeyi OCR yapmayı deneyin.
Aranabilir PDF'i OCR yapmayı hiç denemedim ama ilk birkaç sayfasını OCR yapıp deneyin. Olursa tamamını yaparsınız.
Belgenin çözünürlüğü çok iyi. İyi bir OCR sonucu çıkar. Yani az hata ile.
dediğiniz programla mümkün müdür
 

bilexsamet

Müdavim
Müdavim
Katılım
18 Aralık 2013
Mesajlar
3,145
Reaksiyon puanı
2,415
Puanları
358
anladım teşekkür ederim tekrar bi bilgi bulursanız iletişime geçerseniz memnun olurum

Şimdi online OCR sitelerinden deneme yaptım. OCR sonuçları iyi çıkıyor. Ama ücretsiz online OCR sitelerinde genelde sayfa sayısı sınırı var.

Bence ABBY FineReader ile temiz bir sonuç alırsınız. Word'e OCR yaparsanız hatalı metni daha iyi görürsünüz. Yine OCR'den sonra aynı şekilde aranabilir PDF olarak da kaydedebilirsiniz. Aranabilir PDF olarak kaydederseniz. Şimdiki gibi metni olduğu gibi görürsünüz ama Ctrl+F ile arama yapar veya kopyalama yapmaya çalışırsanız arkaplandaki OCR sonucunu kopyalar.
 

ejderkulesi37

Öğrenci
Katılım
5 Haziran 2020
Mesajlar
11
Reaksiyon puanı
12
Puanları
3
Yaş
24
dediklerinizi yaptım ABBY programıyla fakat en fazla 100 sayfa aranabilir pdf kaydedebiliyorum.
 
Üst