IT/php

php htmlspecialchars — 특수 문자를 HTML 엔터티로 변환

조원태 2016. 11. 3. 11:39
반응형

htmlspecialchars


(PHP 4, PHP 5, PHP 7)

htmlspecialchars — 특수 문자를 HTML 엔터티로 변환


설명 ¶


string htmlspecialchars ( string $string [, int $quote_style [, string $charset [, bool $double_encode ]]] )

어떤 문자들은 HTML에서 특별한 정의를 가지기에, 그 의미를 보존하려면, HTML 엔터티로 표현해야 합니다. 이 함수는 이러한 변환을 수행한 문자열을 반환합니다; 이 번역은 모든 웹 프로그래밍에서 매우 유용합니다. 모든 HTML 문자 엔터티를 번역해야 한다면, 이 함수 대신 htmlentities()를 사용하십시오.


이 함수로 게시판이나 방명록 등의 프로그램에서, HTML을 포함하는 사용자 입력 텍스트를 막을 수 있습니다.


변환이 일어나는 문자는:


'&'(앰퍼샌드)는 '&'가 됩니다

'"'(겹따옴표)는 ENT_NOQUOTES를 설정하지 않았을 때 '"'가 됩니다.

'''(홑따옴표)는 ENT_QUOTES가 설정되었을 때만 '''가 됩니다.

'<'(미만)은 '&lt;'가 됩니다.

'>'(이상)은 '&gt;'가 됩니다.

인수 ¶


string

변환할 string.


quote_style

선택적인 두번째 인수 quote_style은 홑따옴표와 겹따옴표를 어떻게 처리할지 결정합니다. 기본 모드는 하위 호환 모드 ENT_COMPAT로, 겹따옴표만 변환합니다. ENT_QUOTES를 지정하면 홑따옴표와 겹따옴표 둘 다 변환하고, ENT_NOQUOTES를 지정하면 홑따옴표와 큰 따옴표 둘 다 변환하지 않습니다.


charset

변환에 사용할 문자셋을 정의합니다. 기본 문자셋은 ISO-8859-1입니다.


PHP 4.3.0 이상에서 다음 문자셋을 지원합니다.


지원 문자셋

문자셋 다른 이름 설명

ISO-8859-1 ISO8859-1 서부 유럽어, Latin-1.

ISO-8859-15 ISO8859-15 서부 유럽어, Latin-9. 유로 사인, Latin-1(ISO-8859-1)에 빠진 프랑스어와 핀란드어 문자 추가.

UTF-8 아스키 호환 멀티바이트 8비트 유니코드.

cp866 ibm866, 866 DOS-특정 키릴 문자셋. 이 문자셋은 4.3.2부터 지원합니다.

cp1251 Windows-1251, win-1251, 1251 윈도우-특정 키릴 문자셋. 이 문자셋은 4.3.2부터 지원합니다.

cp1252 Windows-1252, 1252 윈도우 특정 서부 유럽어 문자셋

KOI8-R koi8-ru, koi8r 러시아어. 이 문자셋은 4.3.2부터 지원합니다.

BIG5 950 중국어 번체, 주로 대만에서 사용.

GB2312 936 중국어 간체, 국가 표준 문자셋.

BIG5-HKSCS 홍콩 확장을 포함한 Big5, 중국어 번체.

Shift_JIS SJIS, 932 일본어.

EUC-JP EUCJP 일본어.

Note: 다른 문자셋에 대해서는 ISO-8859-1을 사용합니다.

double_encode

double_encode를 끄면 PHP는 이미 존재하는 html 엔티티를 인코드하지 않습니다. 기본값은 모두 변환합니다.


반환값 ¶


변환된 string.


변경점 ¶


버전 설명

5.2.3 double_encode 인수 추가.

4.1.0 charset 인수 추가.

예제 ¶


Example #1 htmlspecialchars() 예제


<?php

$new = htmlspecialchars("<a href='test'>Test</a>", ENT_QUOTES);

echo $new; // &lt;a href=&#039;test&#039;&gt;TEST&lt;/a&gt;

?>

반응형