Pdf Kelime Arama Sorunu

Bu konuyu okuyanlar

ejderkulesi37

Öğrenci
Katılım
5 Haziran 2020
Mesajlar
11
Reaksiyon puanı
12
Puanları
3
Yaş
23
Merhabalar elimde bir kitabın pdf'si var. Pdf tamamen Türkçe şekilde görünüyor fakat bir kelime aramaya çalıştığımda hiç bir şekilde bulunmuyor. Metinde bir iki kelime işaretleyip sağ tık yapınca .DPXDLJKHG şeklinde ana metin görünüyor sanırım. Yani metinin ana dili farklı olduğu için Türkçe kelime araması yapamıyorum. Bu sorunun çözümü nedir yarın final sınavım var yardımcı olabilir misiniz? Çıkan ana metini ek olarak ekliyorum.

cache-v2
SORUN
 

bilexsamet

Müdavim
Katılım
18 Aralık 2013
Mesajlar
3,144
Reaksiyon puanı
2,419
Puanları
113
O belge önceden belki resim, belki arama yapılamayan bir PDF veya TIF dosyası iken sanırım birisi o belgeyi aranabilir PDF'e çevirmiş. Yani OCR ile aranabilir PDF yapılmış ama program iyi OCR yapamamış anlaşılan.

Aranabilir PDF'lerde görüntü bir resim iken seçtiğiniz kelimenin altında OCR yapılmış (yani resimden karaktere çevrilmiş) bir metin vardır.
Mesaj otomatik birleştirildi:

Belge kaç sayfa?
 

ejderkulesi37

Öğrenci
Katılım
5 Haziran 2020
Mesajlar
11
Reaksiyon puanı
12
Puanları
3
Yaş
23
O belge önceden belki resim, belki arama yapılamayan bir PDF veya TIF dosyası iken sanırım birisi o belgeyi aranabilir PDF'e çevirmiş. Yani OCR ile aranabilir PDF yapılmış ama program iyi OCR yapamamış anlaşılan.

Aranabilir PDF'lerde görüntü bir resim iken seçtiğiniz kelimenin altında OCR yapılmış (yani resimden karaktere çevrilmiş) bir metin vardır.
Mesaj otomatik birleştirildi:

Belge kaç sayfa?
bir çözümü var mı peki hocam Türkçe arama yapabilmem için ?
 

bilexsamet

Müdavim
Katılım
18 Aralık 2013
Mesajlar
3,144
Reaksiyon puanı
2,419
Puanları
113
Eğer görüntü çözünürlüğü yüksek ise ABBYY FineReader programı ile tekrar OCR yapmayı deneyebilirsiniz.

ABBYY Fine Reader, Türkçe karakterli belge ve resimleri çok iyi OCR yapıyor. Yani resmi metne çeviriyor. Online OCR yapan siteler de var ama ne ölçüde iyi çeviri bilemem.

Sizin mecburen o belgeyi tekrar OCR yapmanız gerekiyor. Çünkü eski OCR tam bir fiyaskoymuş. Yaptığı OCR'nin yazılı metin ile alakası yok.

Ama OCR sağlıklı bir yöntem değil. Onu belirteyim. Çünkü OCR'de bildiğiniz resimdeki yazıyı kopyalabilecek bir karakterlere çeviriyor. Mesela metindeki "s" harfinin altına bakımdan kaynaklı küçük bir mürekkep gelmiştir ve program onu "ş" olarak OCR yapabilir. Veya çözünürlük düşükse veya sayfa yamuksa bazı harfleri başka bir harf olarak algılayabilir.
 
Son düzenleme:

ejderkulesi37

Öğrenci
Katılım
5 Haziran 2020
Mesajlar
11
Reaksiyon puanı
12
Puanları
3
Yaş
23
Eğer görüntü çözünürlüğü yüksek ise ABBYY FineReader programı tekrar OCR yapmayı deneyebilirsiniz.

ABBYY Fine Reader, Türkçe karakterli belge ve resimleri çok iyi OCR yapıyor. Yani resmi metne çeviriyor. Online OCR yapan siteler de var ama ne ölçüde yi çeviri bilemem.

Sizin mecburen o belgeyi tekrar OCR yapmanız gerekiyor. Çünkü eski OCR tam bir fiyaskoymuş. Yaptığı OCR'nin yazılı metin ile alakası yok.

Ama OCR sağlıklı bir yöntem değil. Onu belirteyim. Çünkü OCR'de bildiğiniz resmdeki yazıyı kopyalabilecek bir karakterlere çeviriyor. Mesela metindeki "s" harfinin altına bakımdan kaynaklı küçük bir mürekkep gelmiştir ve program onu "ş" olarak OCR yapabilir. Veya çözünürlük düşükse veya sayfa yamuksa bazı harfleri başka bir harf olarak algılayabilir.
İlgi ve alakanız için teşekkür ederim, fakat şuan elimdeki pdf resim formatında değil metin formatında yine de söylediğiniz program işe yarar mı ?
 

"Melih"

Müdavim
Katılım
21 Temmuz 2019
Mesajlar
3,034
Reaksiyon puanı
1,933
Puanları
113
Microsoft store dll yazınız orda çikabilir.
Merhabalar elimde bir kitabın pdf'si var. Pdf tamamen Türkçe şekilde görünüyor fakat bir kelime aramaya çalıştığımda hiç bir şekilde bulunmuyor. Metinde bir iki kelime işaretleyip sağ tık yapınca .DPXDLJKHG şeklinde ana metin görünüyor sanırım. Yani metinin ana dili farklı olduğu için Türkçe kelime araması yapamıyorum. Bu sorunun çözümü nedir yarın final sınavım var yardımcı olabilir misiniz? Çıkan ana metini ek olarak ekliyorum.

cache-v2
SORUN
 

bilexsamet

Müdavim
Katılım
18 Aralık 2013
Mesajlar
3,144
Reaksiyon puanı
2,419
Puanları
113
Belge özel değilse, özel mesaj yoluyla bana gönderebilir misiniz? Bakabilir miyim?
 

bilexsamet

Müdavim
Katılım
18 Aralık 2013
Mesajlar
3,144
Reaksiyon puanı
2,419
Puanları
113
Belge taratılmış bir şey değil ama belgeyi hazırlayan metin olarak kopyalanmasını engellemek için böyle bir şey yapmış sanırım.
 

bilexsamet

Müdavim
Katılım
18 Aralık 2013
Mesajlar
3,144
Reaksiyon puanı
2,419
Puanları
113
Bence belgeyi OCR yapmayı deneyin.
Aranabilir PDF'i OCR yapmayı hiç denemedim ama ilk birkaç sayfasını OCR yapıp deneyin. Olursa tamamını yaparsınız.
Belgenin çözünürlüğü çok iyi. İyi bir OCR sonucu çıkar. Yani az hata ile.
 

ejderkulesi37

Öğrenci
Katılım
5 Haziran 2020
Mesajlar
11
Reaksiyon puanı
12
Puanları
3
Yaş
23
Bence belgeyi OCR yapmayı deneyin.
Aranabilir PDF'i OCR yapmayı hiç denemedim ama ilk birkaç sayfasını OCR yapıp deneyin. Olursa tamamını yaparsınız.
Belgenin çözünürlüğü çok iyi. İyi bir OCR sonucu çıkar. Yani az hata ile.
dediğiniz programla mümkün müdür
 

bilexsamet

Müdavim
Katılım
18 Aralık 2013
Mesajlar
3,144
Reaksiyon puanı
2,419
Puanları
113
anladım teşekkür ederim tekrar bi bilgi bulursanız iletişime geçerseniz memnun olurum

Şimdi online OCR sitelerinden deneme yaptım. OCR sonuçları iyi çıkıyor. Ama ücretsiz online OCR sitelerinde genelde sayfa sayısı sınırı var.

Bence ABBY FineReader ile temiz bir sonuç alırsınız. Word'e OCR yaparsanız hatalı metni daha iyi görürsünüz. Yine OCR'den sonra aynı şekilde aranabilir PDF olarak da kaydedebilirsiniz. Aranabilir PDF olarak kaydederseniz. Şimdiki gibi metni olduğu gibi görürsünüz ama Ctrl+F ile arama yapar veya kopyalama yapmaya çalışırsanız arkaplandaki OCR sonucunu kopyalar.
 

ejderkulesi37

Öğrenci
Katılım
5 Haziran 2020
Mesajlar
11
Reaksiyon puanı
12
Puanları
3
Yaş
23
dediklerinizi yaptım ABBY programıyla fakat en fazla 100 sayfa aranabilir pdf kaydedebiliyorum.
 
Üst