Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 공급자에서 실행할 수 있는 html2text 명령입니다.
프로그램:
이름
html2text - 고급 HTML-텍스트 변환기
개요
HTML2텍스트 -도움
HTML2텍스트 -번역
HTML2텍스트 [ -분석 해제 | -검사 ] [ -디버그 스캐너 ] [ -디버그 파서 ] [ -rc파일 통로 ] [
스타일 ( 팩트 | 예쁜 ) ] [ -폭 폭 ] [ -o 결과물 파일 ] [ -nobs ] [ -아스키 |
-utf8 ] [ -노메타 ] [ 입력 파일 ... ]
기술
HTML2텍스트 에서 HTML 문서를 읽습니다. 입력 파일s, 각각의 형식을
일반 텍스트 문자로 변환하고 결과를 표준 출력(또는 결과물 파일만약
전에, -o 명령줄 옵션이 사용됨).
없는 경우 입력 파일s는 명령줄에 지정됩니다. HTML2텍스트 표준 입력에서 읽습니다.
대시는 입력 파일 표준 입력을 지정하는 다른 방법입니다.
HTML2텍스트 모든 HTML 3.2 구성을 이해하지만 일부만 렌더링할 수 있습니다.
텍스트 출력 형식의 제한. 그러나 프로그램은 좋은 정보를 제공하려고 시도합니다.
렌더링할 수 없는 요소를 대체합니다. HTML2텍스트 HTML 4 입력도 구문 분석하지만
다른 HTML 프로세서만큼 항상 성공적인 것은 아닙니다. 또한 문법적으로 잘못된 것도 허용합니다.
입력하고 "합리적으로" 해석하려고 시도합니다.
길 HTML2텍스트 형식 HTML 문서는 읽은 형식 속성에 의해 제어됩니다.
RC 파일에서. HTML2텍스트 읽기 시도 $HOME/.html2textrc (또는 다음에 의해 지정된 파일
전에, -rc파일 명령줄 옵션); 해당 파일을 읽을 수 없는 경우 HTML2텍스트 읽기 시도
/etc/html2textrc. RC 파일을 읽을 수 없는 경우(또는 RC 파일이 모든
서식 속성) "합리적인" 기본값이 가정됩니다. RC 파일 형식은
에 설명 html2textrc(5) 매뉴얼 페이지.
데비안 버전 HTML2텍스트 또한 입력 및 출력 레코딩을 수행할 수 있습니다(참조
자세한 내용은 /usr/share/doc/html2text/README.Debian). HTML2텍스트 인코딩을 가져오려고 시도합니다.
HTML 문서에서. 인코딩이 지정되지 않은 경우 다음을 사용할 수 있습니다. -아스키 and -utf8 옵션을 제공합니다.
출력은 사용자의 로케일 문자 세트(LC_CTYPE)로 변환됩니다.
옵션
-노메타
기본적으로 Debian 버전의 HTML2텍스트 입력에 'meta http-equiv' 태그 사용
레코딩. 이 옵션은 이 동작을 취소합니다.
-아스키 기본적으로 -노메타 공급되며, HTML2텍스트 사용 UTF-8 출력을 위해.
이 옵션을 지정하면 일반 ASCII 대신 사용됩니다. ASCII가 아닌 방법을 알아보려면
문자가 렌더링되면 "ascii.substitutes" 파일을 참조하십시오.
-utf8 기본적으로 -노메타 공급되며, HTML2텍스트 사용 ISO 8859-1 입력을 위해.
이 옵션을 지정하면 UTF-8 대신 사용됩니다(입력 및 출력 모두). 이것
옵션 의미 -nobs.
-검사 이 옵션은 진단용입니다. HTML 문서는 구문 분석만 하고
그렇지 않으면 처리됩니다. 이 작동 모드에서는 HTML2텍스트 구문 분석에 대해 보고합니다.
다른 작동 모드에서는 발생하지 않는 오류 및 스캔 오류입니다. 참고
구문 분석 및 스캔 오류는 치명적이지 않습니다. HTML2텍스트, 하지만 오해의 소지가 있습니다.
삼키는 HTML 코드 및/또는 문서의 일부.
-디버그 파서
하자 HTML2텍스트 이동되는 토큰, 적용되는 규칙 등에 대해 보고하는 동안
HTML 문서를 스캔합니다. 이 옵션은 진단용입니다.
-디버그 스캐너
하자 HTML2텍스트 HTML을 스캔하는 동안 스캔된 각 어휘 토큰에 대한 보고
문서. 이 옵션은 진단용입니다.
-도움 명령줄 요약을 인쇄하고 종료합니다.
-nobs 기본적으로 원본 HTML2텍스트 다음과 같은 시퀀스로 밑줄이 그어진 문자를 렌더링합니다.
"밑줄-백스페이스-문자" 및 "문자-백스페이스-
문자". UTF-8의 문제로 인해 데비안 버전의 HTML2텍스트 하지 않습니다
백스페이스를 생성하므로 이 옵션은 실제로 아무 작업도 수행하지 않습니다.
-o 결과물 파일
에 출력을 씁니다. 결과물 파일 표준 출력 대신. 대시는
결과물 파일 표준 출력을 지정하는 다른 방법입니다.
-rc파일 통로
지정된 파일 읽기 시도 통로 RC 파일로.
스타일 ( 팩트 | 예쁜 )
스타일 예쁜 서식 매개변수의 일부 기본값을 변경합니다.
문서화 html2textrc(5). 형식화 매개변수의 종류와 방법을 찾으려면
기본값이 변경되면 "pretty.style" 파일을 확인하십시오. 이 옵션을 생략하면
스타일 팩트 기본값으로 간주됩니다.
-분석 해제
이 옵션은 진단용입니다. 구문 분석된 문서를 형식화하는 대신
문법적으로 정확함을 보장하는 HTML 코드를 생성합니다. 만약에 HTML2텍스트
문법적으로 잘못된 HTML 문서를 구문 분석하는 데 문제가 있는 경우 이 옵션이 도움이 될 수 있습니다.
당신은 무엇을 이해 HTML2텍스트 원래 HTML 코드가 의미한다고 생각합니다.
-번역
프로그램 버전을 인쇄하고 종료합니다.
-폭 폭
기본적으로, HTML2텍스트 화면 너비 79에 대한 HTML 문서의 형식을 지정합니다.
문자. 출력을 파일로 리디렉션하거나 터미널에 너비가 있는 경우
80자가 아닌 경우 또는 방법을 알고 싶은 경우 HTML2텍스트 상품
테이블이 크고 터미널 너비가 다른 경우
다른 폭.
onworks.net 서비스를 사용하여 온라인에서 html2text 사용