pstotext - Bulutta Çevrimiçi

Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen komut pstotext'tir.

Program:

ADI


pstotext - bir PostScript veya PDF dosyasından ASCII metni ayıklayın

SÖZDİZİMİ


pstotext [seçenek|yol adı]...

seçenek şunları içerir:

-mantar
- manzara
-manzaraDiğer
-Vesika
-
-çıktı dosyası
-gs komutu
-hata ayıklama
-bbox'lar

TANIM


pstotext bir veya daha fazla PostScript veya PDF dosyasını okur ve standart çıktıya yazar
PostScript dosyası olsaydı görüntülenecek olan düz metnin temsili
basılmış. Aşağıdaki DETAYLAR bölümünde açıklandığı gibi, bu gösterim yalnızca bir
yaklaşıklık. Bununla birlikte, genellikle bilgi almak için yararlıdır (örneğin, koşu
grep(1) veya tam metin dizini oluşturma) veya metni, aşağıdakileri içeren bir PostScript dosyasından kurtarmak için:
Kaybettiğin kaynak.

pstotext Ghostscript'i çağırır ve Aladdin Ghostscript sürüm 3.51 veya daha yenisini gerektirir.
Ghostscript, geçerli arama yolunda gs olarak çağrılabilir olmalıdır. Alternatif olarak,
Ghostscript'i çalıştıracak komutu (yol adı ve seçenekler) belirtmek için -gs seçeneğini kullanın. İçin
örneğin, Windows'ta -gs "c:\gs\gswin32c.exe -Ic:\gs;c:\gs\fonts" kullanabilirsiniz.

pstotext durumunu göz ardı ederek komut satırını soldan sağa okur ve işler.
seçenekler. Bir yol adıyla karşılaştığında dosyayı açar ve bir yol adı bulmayı bekler.
İşlenecek PostScript işi veya PDF belgesi. Seçenek - bir dosyayı okumak ve işlemek anlamına gelir.
Standart girdiden PostScript işi. - veya yol adı bağımsız değişkenleriyle karşılaşılmazsa,
pstotext standart girdiden bir PostScript işi okur. (PDF belgeleri rastgele erişim gerektirir,
bu nedenle standart girdiden okunamaz.) Bir değer belirtmek için -output seçeneğini kullanabilirsiniz.
çıktı dosyası (onu çağırmayı unutmayın) önce giriş dosyası); aksi halde pstotext yazar
standart çıktı.

-cork seçeneği yalnızca TeX veya LaTeX'ten dvips tarafından üretilen PostScript dosyaları için geçerlidir.
belgeler; anlatır pstotext yerine Cork kodlamasını (LaTeX'te T1 olarak bilinir) kullanmak için
eski TeX metin kodlaması (LaTeX'te OT1 olarak bilinir). Maalesef dvips tarafından üretilen dosyalar
hangi yazı tipi kodlamalarının kullanıldığını ayırt etmeyin.

-landscape ve -landscapeOther seçenekleri, olması gereken belgeler için kullanılmalıdır.
okunabilmesi için sırasıyla saat yönünde veya saat yönünün tersine 90 derece döndürülmüştür.

-debug ve -bboxes seçenekleri çoğunlukla pstotext. -hata ayıklama
Ghostscript çıktısını ve hata mesajlarını gösterir. -bboxes ile satır başına bir kelime çıktısı
sınırlayıcı kutu bilgisi.

DETAYLAR


pstotext Ghostscript'e buna neden olan bir PostScript kitaplığı yüklemesini söyleyerek işini yapar.
bir PostScript işi tarafından oluşturulan her dize hakkında standart çıktı bilgilerini yazmak için
veya PDF belgesi. Bu bilgi, dizenin karakterlerini içerir ve yeterli
dizenin sınırlayıcı dikdörtgenine yaklaşmak için ek bilgi. pstotext
bu bilgiyi sonradan işler ve boşlukla sınırlandırılmış bir dizi sözcük çıkarır,
yeni satır ve form besleme.

pstotext sözcükleri belge tarafından işlendikleriyle aynı sırada çıkarır. Bu
genellikle, ancak her zaman değil, bir insanın bir sayfadaki kelimeleri okuyacağı sırayı takip eder.
Bu sıra içinde, kelimeler boşluk veya satırsonu ile ayrılır.
ya da aynı çizgiye düşmezler. Her sayfa bir form beslemesi ile sonlandırılır. Eğer kullanırsan
{-portrait, -landscape, -landscapeOther} kümesindeki yanlış seçenek, pstotext is
boşluk yerine yeni satırı değiştirmesi muhtemeldir.

Bir PostScript işi veya PDF belgesi, elde etmek için genellikle bir kelimeyi birkaç dize olarak işler.
belirli karakter çiftleri arasındaki doğru boşluk. pstotext elinden gelenin en iyisini yapar
basit bir buluşsal yöntem kullanarak bu dizeleri tekrar sözcüklere birleştirin: a ile ayrılmış dizeler
iki karakterdeki ortalama karakter genişliğinin minimumunun 0.3 katından daha az mesafe
dizeler aynı kelimenin parçası olarak kabul edilir. Bunun tipik olarak neden olduğunu unutmayın
bir kelimeye dahil edilecek baştaki ve sondaki noktalama işaretleri.

PostScript dili, içinde karakter kodlarının bulunduğu esnek bir kodlama şeması sağlar.
dizeler belirli karakterleri (sembolleri) seçer, bu nedenle bir PostScript işi herhangi birini kullanmakta serbesttir.
karakter kodu. Diğer yandan, pstotext her zaman ISO 8859-1'e (Latin-1) çevrilir
Batı Avrupa'nın çoğunu kapsayan ASCII'nin bir uzantısı olan karakter kodu
Diller. ISO 8859-1'de bir karakter bulunmadığında, pstotext bir dizi kullanır
karakterler, örneğin uzun tire için "---" veya Abreve için "A\226". pstotext bir tarafından kandırılabilir
Kodlama vektörü Adobe'nin kurallarına uymayan, ancak buluşsal yöntemler içeren yazı tipi
çok çeşitli hatalı çalışan yazı tiplerini işlemesine izin verir.

(pstotext artık tireyi (\255) eksiye (\055) çevirmez.)

onworks.net hizmetlerini kullanarak çevrimiçi pstotext kullanın



En yeni Linux ve Windows çevrimiçi programları