PDF eylemleri
PDF eylemleri, PDF dosyalarından görüntüler, metin ve tablolar ayıklamanızı ve sayfaları yeni belgeler oluşturacak şekilde düzenlemenizi sağlar.
PDF dosyasından metin ayıklamak için PDF'den metin ayıkla eylemini kullanın. Aşağıdaki örnekte parola korumalı bir dosyada belirli bir sayfa aralığından metin ayıklanır. Parola Gelişmiş ayarlarda belirtilir.
Tablosal biçimde düzenlenmiş metinleri ayıklamak için, sonuçların biçimini ve doğruluğunu iyileştirmek amacıyla Yapılandırılmış veriler için iyileştirin seçeneğini etkinleştirin.
PDF dosyasından tablo ayıklamak için, PDF'den tabloları ayıkla eylemini dağıtın, dosyayı seçin ve tabloların ayıklanacağı sayfaları belirtin.
Eylem, PDF tablo bilgilerinin bir listesini içeren ExtractedPDFTables değişkenini üretir. Bu tür listeler hakkında bilgi için Gelişmiş veri türleri bölümüne gidin.
Not
- PDF'den tabloları ayıkla eylemi, Optik Karakter Tanıma (OCR) kullanmaz, bu nedenle taranan PDF'lerden kopyalanamayan metinleri ayıklayamazsınız.
- Eylemin arkasındaki kitaplık, zaman zaman tablo olmayan ek PDF verilerini ayıklar. Bu işlev, yanlışlıkla gerçek bir tabloyu atlama riskini en aza indirir.
PDF dosyalarından bilgi ayıklanmasından ayrı olarak, PDF dosyasındaki sayfaları yeni PDF dosyasına ayıkla eylemini kullanarak mevcut dosyadan yeni bir PDF belgesi oluşturabilirsiniz.
Aşağıdaki örnekte, belirli bir sayfa bileşimi ve bir sayfa aralığı seçilir.
PDF'den metin ayıkla
"PDF'den metin ayıkla" eylemini kullanarak bir PDF dosyasından metin ayıklayabilirsiniz. Eylem özelliklerinde, kaynak PDF dosyasını ve metnin ayıklanması gereken sayfaları tanımlayabilirsiniz. Gelişmiş eylem özellikleri altında, PDF dosyasının korumalı olması durumunda bir parola ve altyapının yapılandırılmış veriler için en iyi duruma getirilmesi gerekip gerekmediğini tanımlayabilirsiniz.
Giriş parametreleri
Bağımsız değişken | İsteğe bağlı | Kabul eder | Varsayılan Değer | Tanım |
---|---|---|---|---|
PDF file | Hayır | Dosya | Metnin ayıklanacağı PDF dosyası. Dosya yolu, dosya veya metin yolunu içeren bir değişken girin | |
Ayıklanacak sayfalar | Yok | Tümü, Tek, Aralık | Tümü | Ayıklanacak sayfa sayısını belirtir: Tüm sayfalar, tek bir sayfa veya sayfa aralığı |
Single page number | Hayır | Sayısal değer | Metnin ayıklanacağı tek sayfanın numarası | |
From page number | Hayır | Sayısal değer | Metnin ayıklanacağı sayfa aralığının ilk sayfa numarası | |
To page number | Hayır | Sayısal değer | Metnin ayıklanacağı sayfa aralığının son sayfa numarası | |
Parola | Evet | Doğrudan şifreli giriş veya Metin değeri | PDF dosyasının parolası. PDF parola korumalı değilse bu alanı boş bırakın | |
Yapılandırılmış veriler için iyileştirin | Yok | Boole değeri | Yanlış | Belgedeki biçimlendirilmiş düzenin tespit edilip edilmeyeceğini belirtin ve metni buna göre ayıklayın |
Değişkenler üretildi
Bağımsız değişken | Türü | Tanım |
---|---|---|
ExtractedPDFText | Metin değeri | Ayıklanan metin |
Özel durumlar
Özel durum | Açıklama |
---|---|
PDF dosyası yok | Dosya belirtilen yolda yok |
Geçersiz parola | Belirtilen parola geçersiz |
Metin ayıklanamadı | Metni ayıklamaya çalışırken hata oluştu |
PDF'den tabloları ayıkla
PDF'den tabloları ayıkla eylemini kullanarak bir PDF dosyasında bulunan tabloları ayıklayabilirsiniz. Eylem özelliklerinde, kaynak PDF dosyasını ve tabloların ayıklanacağı çeşitli sayfaları tanımlayabilirsiniz. Gelişmiş eylem özellikleri altında, PDF dosyasının korumalı olması durumunda bir parola ve tabloda üst bilgilerin olup olmadığını ve son olarak sayfa kenar boşluklarını aşan tabloların birleştirilmesi gerekip gerekmediğini tanımlayabilirsiniz.
Giriş parametreleri
Bağımsız değişken | İsteğe bağlı | Kabul eder | Varsayılan Değer | Tanım |
---|---|---|---|---|
PDF dosyası | Hayır | Dosya | Tabloların ayıklanacağı PDF dosyası. Dosya yolu, dosya veya metin yolunu içeren bir değişken girin | |
Ayıklanacak sayfalar | Yok | Tümü, Tek, Aralık | Tümü | Tabloların ayıklanacağı sayfa sayısını belirtir: tüm sayfalar, tek bir sayfa veya sayfa aralığı |
Tek sayfa numarası | Hayır | Sayısal değer | Tabloların ayıklanacağı tek sayfanın numarası | |
Başlangıç sayfa numarası | Hayır | Sayısal değer | Tabloların ayıklanacağı sayfa aralığının ilk sayfa numarası | |
Bitiş sayfa numarası | Hayır | Sayısal değer | Tabloların ayıklanacağı sayfa aralığının son sayfa numarası | |
Parola | Evet | Doğrudan şifreli giriş veya Metin değeri | PDF dosyasının parolası. PDF parola korumalı değilse bu alanı boş bırakın | |
Sayfa kenar boşlukları kesişen tabloları birleştir | Yok | Boole değeri | Doğru | Belirtilen sayfa aralığında sayfa kenar boşlukları kesişen tabloların birleştirilip birleştirilmeyeceğini belirtir |
İlk satır, sütun adlarını içerir | Yok | Boole değeri | Doğru | Tablonun birinci satırının sütun adlarını içerip içermediğini belirtir |
Değişkenler üretildi
Bağımsız değişken | Türü | Tanım |
---|---|---|
ExtractedPDFTables | PDF tablo bilgilerinin listesi | Liste olarak bilgilerini içeren ayıklanmış tablolar |
Özel durumlar
Özel durum | Açıklama |
---|---|
PDF dosyası yok | Dosya belirtilen yolda yok |
Geçersiz parola | Belirtilen parola geçersiz |
Tablolar ayıklanamadı | Tablolar ayıklanmaya çalışırken hata oluştu |
PDF'deki görüntüleri ayıkla
PDF dosyasından görüntü ayıklamak için PDF'deki görüntüleri ayıkla eylemini kullanabilirsiniz. Eylem parametrelerinde, PDF dosyasını ve görüntülerin ayıklanacağı sayfaları, ayıklanan görüntülerin adlandırma kuralını ve kaydedilen görüntülerin hedef konumunu tanımlayabilirsiniz. Ayrıca gelişmiş ayarlar altında, PDF dosyası korumalıysa bir parola da tanımlayabilirsiniz.
Giriş parametreleri
Bağımsız değişken | İsteğe bağlı | Kabul eder | Varsayılan Değer | Tanım |
---|---|---|---|---|
PDF file | Hayır | Dosya | Görüntülerin ayıklanacağı PDF dosyası. Dosya yolu, dosya veya metin yolunu içeren bir değişken girin | |
Parola | Evet | Doğrudan şifreli giriş veya Metin değeri | PDF dosyasının parolası. PDF parola korumalı değilse bu alanı boş bırakın | |
Page(s) to extract | Yok | Tümü, tek, Aralık | Tümü | Ayıklanacak sayfa sayısını belirtir: Tüm sayfalar, tek bir sayfa veya sayfa aralığı |
Single page number | Hayır | Sayısal değer | Görüntülerin ayıklanacağı tek sayfanın numarası | |
From page number | Hayır | Sayısal değer | Görüntülerin ayıklanacağı sayfa aralığının ilk sayfa numarası | |
To page number | Hayır | Sayısal değer | Görüntülerin ayıklanacağı sayfa aralığının son sayfa numarası | |
Image(s) name | Hayır | Metin değeri | Görüntülerin adının nasıl başlayacağı. Ayıklanan görüntü adı örnek: GivenName_1, GivenName_2 | |
Save image(s) to | Hayır | Klasör | Ayıklanan görüntülerin PNG dosyaları olarak kaydedileceği klasör |
Değişkenler üretildi
Bu eylem herhangi bir değişken oluşturmaz.
Özel durumlar
Özel durum | Tanım |
---|---|
Geçersiz parola | Belirtilen parola geçersiz |
Görüntüler ayıklanamadı | PDF'nin belirtilen sayfalarından görüntüler ayıklanırken bir hata oluştuğunu gösterir |
Klasör yok | Klasörün var olmadığını gösterir |
PDF dosyası yok | Dosya belirtilen yolda yok |
PDF dosyası sayfalarını yeni PDF dosyasına ayıkla
PDF dosyası sayfalarını yeni PDF dosyasına dönüştür eylemini kullanarak mevcut bir PDF dosyasından sayfaları ayıklayarak yeni bir PDF dosyası oluşturabilirsiniz. Eylem parametrelerinde, sayfaların ayıklanacağı PDF dosyasını, ayıklanacak sayfaları, yeni PDF dosyasının konumunu ve aynı ad ve uzantıya sahip bir dosya zaten mevcutsa ne olması gerektiğini tanımlayabilirsiniz. Son olarak gelişmiş özellikler altında, kaynak PDF'nin korumalı olması durumunda bir parola tanımlayabilirsiniz.
Giriş parametreleri
Bağımsız değişken | İsteğe bağlı | Kabul eder | Varsayılan Değer | Tanım |
---|---|---|---|---|
PDF file | Hayır | Dosya | Sayfaların ayıklanacağı PDF dosyası. Dosya yolu, dosya veya metin yolunu içeren bir değişken girin | |
Parola | Evet | Doğrudan şifreli giriş veya Metin değeri | PDF dosyasının parolası. PDF parola korumalı değilse bu alanı boş bırakın | |
Page selection | Hayır | Metin değeri | Tutulacak sayfaların dizin numaraları (örneğin 1, 3, 17-24) | |
Extracted PDF path | Hayır | Dosya | Ayıklanan PDF dosyasının depolanacağı yol | |
If file exists | Yok | Üzerine yaz, Üzerine yazma, sıralı sonek ekle | Sıralı sonek ekle | Çıktı PDF dosyasının zaten var olması durumunda ne yapılacağını belirtir |
Değişkenler üretildi
Bağımsız değişken | Türü | Tanım |
---|---|---|
ExtractedPDF | Dosya | Yeni PDF dosyası |
Özel durumlar
Özel durum | Açıklama |
---|---|
Geçersiz parola | Belirtilen parola geçersiz |
PDF dosyası yok | Dosya belirtilen yolda yok |
Sayfa sınırlar dışında | Bir veya daha fazla sayfanın PDF dosyasının sınırları dışında olduğunu gösterir |
Geçersiz sayfa seçimi | Belirtilen sayfaların PDF dosyası için geçerli olmadığını gösterir |
Yeni PDF ayıklanamadı | Yeni PDF ayıklanmaya çalışılırken bir hata oluştuğunu gösterir |
PDF dosyalarını birleştir
Birden çok PDF dosyasını yeni bir PDF'de birleştirir.
İki veya daha fazla PDF dosyası kullanıp bunları tek bir dosyada birleştirmek için PDF dosyalarını birleştir eylemini kullanabilirsiniz. Birleştirilecek dosyalar, liste şeklinde veya çift tırnak arasında alınmış ve bir sınırlayıcıyla ayrılmış olarak sağlanabilir. Ayrıca parola korumalı olmaları durumunda PDF dosyalarına yönelik parolalar da sağlayabilirsiniz.
Giriş parametreleri
Bağımsız değişken | İsteğe bağlı | Kabul eder | Varsayılan Değer | Tanım |
---|---|---|---|---|
PDF files | Hayır | Dosyalarınlistesi | Birleştirilecek dosyalar. Birden çok dosyayı çift tırnak (") içine alın ve sınırlayıcı ile ayırın ya da dosya listesi kullanın | |
Merged PDF path | Hayır | Dosya | Birleştiren PDF dosyasının depolanacağı yol | |
If file exists | Yok | Üzerine yaz, Üzerine yazma, sıralı sonek ekle | Sıralı sonek ekle | Hedef dosyanın zaten var olması durumunda ne yapılacağını belirtir |
Parolalar | Evet | Doğrudan şifreli giriş veya Metin değeri | Sınırlandırılmış parolalar. Sıralama, giriş PDF'lerinin sıralamasıyla aynı olmalıdır. PDF'ler parola korumalı değilse bu alanı boş bırakın | |
Sınırlayıcı | Hayır | Metin değeri | . | Özel bir parola sınırlayıcı. Bu sınırlayıcının hiçbir parolanın parçası olmaması gerekir |
Değişkenler üretildi
Bağımsız değişken | Türü | Tanım |
---|---|---|
MergedPDF | Dosya | Birleştirilen PDF dosyası |
Özel durumlar
Özel durum | Açıklama |
---|---|
PDF dosyası yok | Dosya belirtilen yolda yok |
Geçersiz parola | Belirtilen parola geçersiz |
PDF dosyaları birleştirilemedi | Dosyalar birleştirilirken bir hata oluştuğunu gösterir |