PDF eylemleri

PDF eylemleri, PDF dosyalarından görüntüler, metin ve tablolar ayıklamanızı ve sayfaları yeni belgeler oluşturacak şekilde düzenlemenizi sağlar.

PDF dosyasından metin ayıklamak için PDF'den metin ayıkla eylemini kullanın. Aşağıdaki örnekte parola korumalı bir dosyada belirli bir sayfa aralığından metin ayıklanır. Parola Gelişmiş ayarlarda belirtilir.

Tablosal biçimde düzenlenmiş metinleri ayıklamak için, sonuçların biçimini ve doğruluğunu iyileştirmek amacıyla Yapılandırılmış veriler için iyileştirin seçeneğini etkinleştirin.

PDF'den Metin ayıkla eyleminin ekran görüntüsü.

PDF dosyasından tablo ayıklamak için, PDF'den tabloları ayıkla eylemini dağıtın, dosyayı seçin ve tabloların ayıklanacağı sayfaları belirtin.

Eylem, PDF tablo bilgilerinin bir listesini içeren ExtractedPDFTables değişkenini üretir. Bu tür listeler hakkında bilgi için Gelişmiş veri türleri bölümüne gidin.

Not

  • PDF'den tabloları ayıkla eylemi, Optik Karakter Tanıma (OCR) kullanmaz, bu nedenle taranan PDF'lerden kopyalanamayan metinleri ayıklayamazsınız.
  • Eylemin arkasındaki kitaplık, zaman zaman tablo olmayan ek PDF verilerini ayıklar. Bu işlev, yanlışlıkla gerçek bir tabloyu atlama riskini en aza indirir.

PDF'den tabloları ayıkla eyleminin ekran görüntüsü.

PDF dosyalarından bilgi ayıklanmasından ayrı olarak, PDF dosyasındaki sayfaları yeni PDF dosyasına ayıkla eylemini kullanarak mevcut dosyadan yeni bir PDF belgesi oluşturabilirsiniz.

Aşağıdaki örnekte, belirli bir sayfa bileşimi ve bir sayfa aralığı seçilir.

PDF dosyasındaki sayfaları yeni PDF dosyasına ayıkla eyleminin ekran görüntüsü.

PDF'den metin ayıkla

"PDF'den metin ayıkla" eylemini kullanarak bir PDF dosyasından metin ayıklayabilirsiniz. Eylem özelliklerinde, kaynak PDF dosyasını ve metnin ayıklanması gereken sayfaları tanımlayabilirsiniz. Gelişmiş eylem özellikleri altında, PDF dosyasının korumalı olması durumunda bir parola ve altyapının yapılandırılmış veriler için en iyi duruma getirilmesi gerekip gerekmediğini tanımlayabilirsiniz.

Giriş parametreleri

Bağımsız değişken İsteğe bağlı Kabul eder Varsayılan Değer Tanım
PDF file Hayır Dosya Metnin ayıklanacağı PDF dosyası. Dosya yolu, dosya veya metin yolunu içeren bir değişken girin
Ayıklanacak sayfalar Yok Tümü, Tek, Aralık Tümü Ayıklanacak sayfa sayısını belirtir: Tüm sayfalar, tek bir sayfa veya sayfa aralığı
Single page number Hayır Sayısal değer Metnin ayıklanacağı tek sayfanın numarası
From page number Hayır Sayısal değer Metnin ayıklanacağı sayfa aralığının ilk sayfa numarası
To page number Hayır Sayısal değer Metnin ayıklanacağı sayfa aralığının son sayfa numarası
Parola Evet Doğrudan şifreli giriş veya Metin değeri PDF dosyasının parolası. PDF parola korumalı değilse bu alanı boş bırakın
Yapılandırılmış veriler için iyileştirin Yok Boole değeri Yanlış Belgedeki biçimlendirilmiş düzenin tespit edilip edilmeyeceğini belirtin ve metni buna göre ayıklayın

Değişkenler üretildi

Bağımsız değişken Türü Tanım
ExtractedPDFText Metin değeri Ayıklanan metin

Özel durumlar

Özel durum Açıklama
PDF dosyası yok Dosya belirtilen yolda yok
Geçersiz parola Belirtilen parola geçersiz
Metin ayıklanamadı Metni ayıklamaya çalışırken hata oluştu

PDF'den tabloları ayıkla

PDF'den tabloları ayıkla eylemini kullanarak bir PDF dosyasında bulunan tabloları ayıklayabilirsiniz. Eylem özelliklerinde, kaynak PDF dosyasını ve tabloların ayıklanacağı çeşitli sayfaları tanımlayabilirsiniz. Gelişmiş eylem özellikleri altında, PDF dosyasının korumalı olması durumunda bir parola ve tabloda üst bilgilerin olup olmadığını ve son olarak sayfa kenar boşluklarını aşan tabloların birleştirilmesi gerekip gerekmediğini tanımlayabilirsiniz.

Giriş parametreleri

Bağımsız değişken İsteğe bağlı Kabul eder Varsayılan Değer Tanım
PDF dosyası Hayır Dosya Tabloların ayıklanacağı PDF dosyası. Dosya yolu, dosya veya metin yolunu içeren bir değişken girin
Ayıklanacak sayfalar Yok Tümü, Tek, Aralık Tümü Tabloların ayıklanacağı sayfa sayısını belirtir: tüm sayfalar, tek bir sayfa veya sayfa aralığı
Tek sayfa numarası Hayır Sayısal değer Tabloların ayıklanacağı tek sayfanın numarası
Başlangıç sayfa numarası Hayır Sayısal değer Tabloların ayıklanacağı sayfa aralığının ilk sayfa numarası
Bitiş sayfa numarası Hayır Sayısal değer Tabloların ayıklanacağı sayfa aralığının son sayfa numarası
Parola Evet Doğrudan şifreli giriş veya Metin değeri PDF dosyasının parolası. PDF parola korumalı değilse bu alanı boş bırakın
Sayfa kenar boşlukları kesişen tabloları birleştir Yok Boole değeri Doğru Belirtilen sayfa aralığında sayfa kenar boşlukları kesişen tabloların birleştirilip birleştirilmeyeceğini belirtir
İlk satır, sütun adlarını içerir Yok Boole değeri Doğru Tablonun birinci satırının sütun adlarını içerip içermediğini belirtir

Değişkenler üretildi

Bağımsız değişken Türü Tanım
ExtractedPDFTables PDF tablo bilgilerinin listesi Liste olarak bilgilerini içeren ayıklanmış tablolar

Özel durumlar

Özel durum Açıklama
PDF dosyası yok Dosya belirtilen yolda yok
Geçersiz parola Belirtilen parola geçersiz
Tablolar ayıklanamadı Tablolar ayıklanmaya çalışırken hata oluştu

PDF'deki görüntüleri ayıkla

PDF dosyasından görüntü ayıklamak için PDF'deki görüntüleri ayıkla eylemini kullanabilirsiniz. Eylem parametrelerinde, PDF dosyasını ve görüntülerin ayıklanacağı sayfaları, ayıklanan görüntülerin adlandırma kuralını ve kaydedilen görüntülerin hedef konumunu tanımlayabilirsiniz. Ayrıca gelişmiş ayarlar altında, PDF dosyası korumalıysa bir parola da tanımlayabilirsiniz.

Giriş parametreleri

Bağımsız değişken İsteğe bağlı Kabul eder Varsayılan Değer Tanım
PDF file Hayır Dosya Görüntülerin ayıklanacağı PDF dosyası. Dosya yolu, dosya veya metin yolunu içeren bir değişken girin
Parola Evet Doğrudan şifreli giriş veya Metin değeri PDF dosyasının parolası. PDF parola korumalı değilse bu alanı boş bırakın
Page(s) to extract Yok Tümü, tek, Aralık Tümü Ayıklanacak sayfa sayısını belirtir: Tüm sayfalar, tek bir sayfa veya sayfa aralığı
Single page number Hayır Sayısal değer Görüntülerin ayıklanacağı tek sayfanın numarası
From page number Hayır Sayısal değer Görüntülerin ayıklanacağı sayfa aralığının ilk sayfa numarası
To page number Hayır Sayısal değer Görüntülerin ayıklanacağı sayfa aralığının son sayfa numarası
Image(s) name Hayır Metin değeri Görüntülerin adının nasıl başlayacağı. Ayıklanan görüntü adı örnek: GivenName_1, GivenName_2
Save image(s) to Hayır Klasör Ayıklanan görüntülerin PNG dosyaları olarak kaydedileceği klasör

Değişkenler üretildi

Bu eylem herhangi bir değişken oluşturmaz.

Özel durumlar

Özel durum Tanım
Geçersiz parola Belirtilen parola geçersiz
Görüntüler ayıklanamadı PDF'nin belirtilen sayfalarından görüntüler ayıklanırken bir hata oluştuğunu gösterir
Klasör yok Klasörün var olmadığını gösterir
PDF dosyası yok Dosya belirtilen yolda yok

PDF dosyası sayfalarını yeni PDF dosyasına ayıkla

PDF dosyası sayfalarını yeni PDF dosyasına dönüştür eylemini kullanarak mevcut bir PDF dosyasından sayfaları ayıklayarak yeni bir PDF dosyası oluşturabilirsiniz. Eylem parametrelerinde, sayfaların ayıklanacağı PDF dosyasını, ayıklanacak sayfaları, yeni PDF dosyasının konumunu ve aynı ad ve uzantıya sahip bir dosya zaten mevcutsa ne olması gerektiğini tanımlayabilirsiniz. Son olarak gelişmiş özellikler altında, kaynak PDF'nin korumalı olması durumunda bir parola tanımlayabilirsiniz.

Giriş parametreleri

Bağımsız değişken İsteğe bağlı Kabul eder Varsayılan Değer Tanım
PDF file Hayır Dosya Sayfaların ayıklanacağı PDF dosyası. Dosya yolu, dosya veya metin yolunu içeren bir değişken girin
Parola Evet Doğrudan şifreli giriş veya Metin değeri PDF dosyasının parolası. PDF parola korumalı değilse bu alanı boş bırakın
Page selection Hayır Metin değeri Tutulacak sayfaların dizin numaraları (örneğin 1, 3, 17-24)
Extracted PDF path Hayır Dosya Ayıklanan PDF dosyasının depolanacağı yol
If file exists Yok Üzerine yaz, Üzerine yazma, sıralı sonek ekle Sıralı sonek ekle Çıktı PDF dosyasının zaten var olması durumunda ne yapılacağını belirtir

Değişkenler üretildi

Bağımsız değişken Türü Tanım
ExtractedPDF Dosya Yeni PDF dosyası

Özel durumlar

Özel durum Açıklama
Geçersiz parola Belirtilen parola geçersiz
PDF dosyası yok Dosya belirtilen yolda yok
Sayfa sınırlar dışında Bir veya daha fazla sayfanın PDF dosyasının sınırları dışında olduğunu gösterir
Geçersiz sayfa seçimi Belirtilen sayfaların PDF dosyası için geçerli olmadığını gösterir
Yeni PDF ayıklanamadı Yeni PDF ayıklanmaya çalışılırken bir hata oluştuğunu gösterir

PDF dosyalarını birleştir

Birden çok PDF dosyasını yeni bir PDF'de birleştirir.

İki veya daha fazla PDF dosyası kullanıp bunları tek bir dosyada birleştirmek için PDF dosyalarını birleştir eylemini kullanabilirsiniz. Birleştirilecek dosyalar, liste şeklinde veya çift tırnak arasında alınmış ve bir sınırlayıcıyla ayrılmış olarak sağlanabilir. Ayrıca parola korumalı olmaları durumunda PDF dosyalarına yönelik parolalar da sağlayabilirsiniz.

Giriş parametreleri

Bağımsız değişken İsteğe bağlı Kabul eder Varsayılan Değer Tanım
PDF files Hayır Dosyalarınlistesi Birleştirilecek dosyalar. Birden çok dosyayı çift tırnak (") içine alın ve sınırlayıcı ile ayırın ya da dosya listesi kullanın
Merged PDF path Hayır Dosya Birleştiren PDF dosyasının depolanacağı yol
If file exists Yok Üzerine yaz, Üzerine yazma, sıralı sonek ekle Sıralı sonek ekle Hedef dosyanın zaten var olması durumunda ne yapılacağını belirtir
Parolalar Evet Doğrudan şifreli giriş veya Metin değeri Sınırlandırılmış parolalar. Sıralama, giriş PDF'lerinin sıralamasıyla aynı olmalıdır. PDF'ler parola korumalı değilse bu alanı boş bırakın
Sınırlayıcı Hayır Metin değeri . Özel bir parola sınırlayıcı. Bu sınırlayıcının hiçbir parolanın parçası olmaması gerekir

Değişkenler üretildi

Bağımsız değişken Türü Tanım
MergedPDF Dosya Birleştirilen PDF dosyası

Özel durumlar

Özel durum Açıklama
PDF dosyası yok Dosya belirtilen yolda yok
Geçersiz parola Belirtilen parola geçersiz
PDF dosyaları birleştirilemedi Dosyalar birleştirilirken bir hata oluştuğunu gösterir