您可以在这个页面下载这个文档附带de文件,也可以在文件下载中de字符处理中下载这个文档描述如何安全显示de有格式de用户输入.我将讨论没有经过过滤de输出de危险,给出一个安全de显示格式化输出de方法.
没有过滤输出de危险
如果您仅仅获得用户de输入然后显示它,您可能会破坏您de输出页面,如一些人能恶意地在他们提交de输入框中嵌入javascript脚本:
This is my comment.
<script language=”javascript:
alert(’Do something bad here!’)”>.
这样,即使用户不是恶意de,也会破坏您de一些HTMLde语句,如一个表格突然中断,或是页面显示不完整.
只显示无格式de文本
这是一个最简单de解决方案,您只是将用户提交de信息显示为无格式de文本.使用htmlspecialchars()函数,将转化全部de字符为HTMLde编码.
如<b>将转变为<b>,这可以保证不会有意想不到deHTML标记在不适当de时候输出.
这是一个好de解决方案,如果您de用户只关注没有格式de文本内容.但是,如果您给出一些可以格式化de能力,它将更好一些.
Formatting with Custom Markup Tags
用户自己de标记作格式化
您可以提供特殊de标记给用户使用,例如,您可以允许使用[b]…[/b]加重显示,[i]…[/i]斜体显示,这样做简单de查找替换操作就可以了: $output = str_replace(”[b]“, “<b>”, $output);
$output = str_replace(”[i]“, “<i>”, $output);
再作de好一点,我可以允许用户键入一些链接.例如,用户将允许输入[link="url"]…[/link],我将转换为<a href=”">…</a>语句
这时,我不能使用一个简单de查找替换,应该使用正则表达式进行替换:
$output = ereg_replace(’\[link="([[:graph:]] )”\]’, ‘<a href=”\\1″>’, $output);
ereg_replace()de执行就是:
查找出现[link="..."]de字符串,使用<a href=”…”> 替换它
[[:graph:]]de含义是任何非空字符,有关正则表达式请看相关de文章.
在outputlib.phpdeformat_output()函数提供这些标记de转换,总体上de原则是:
调用htmlspecialchars()将HTML标记转换成特殊编码,将不该显示deHTML标记过滤掉,
然后,将一系列我自定义de标记转换相应deHTML标记.
请参看下面de源相关代码:
<?php
function format_output($output) {
/****************************************************************************
* Takes a raw string ($output) and formats it for output using a special
* stripped down markup that is similar to HTML
****************************************************************************/
$output = htmlspecialchars(stripslashes($output));
/* new paragraph */
$output = str_replace(’[p]‘, ‘<p>’, $output);
/* bold */
$output = str_replace(’[b]‘, ‘<b>’, $output);
$output = str_replace(’[/b]‘, ‘</b>’, $output);
/* italics */
$output = str_replace(’[i]‘, ‘<i>’, $output);
$output = str_replace(’[/i]‘, ‘</i>’, $output);
/* preformatted */
$output = str_replace(’[pre]‘, ‘<pre>’, $output);
$output = str_replace(’[/pre]‘, ‘</pre>’, $output);
/* indented blocks (blockquote) */
$output = str_replace(’[indent]‘, ‘<blockquote>’, $output);
$output = str_replace(’[/indent]‘, ‘</blockquote>’, $output);
/* anchors */
$output = ereg_replace(’\[anchor="([[:graph:]] )”\]’, ‘<a name=”\\1″></a>’, $output);
/* links, note we try to prevent javascript in links */
$output = str_replace(’[link="javascript', '[link=" javascript', $output);
$output = ereg_replace('\[link="([[:graph:]] )”\]’, ‘<a href=”\\1″>’, $output);
$output = str_replace(’[/link]‘, ‘</a>’, $output);
return nl2br($output);
}
?>
一些注意de地方:
记住替换自定义标记生成HTML标记字符串是在调用htmlspecialchars()函数之后,而不是在这个调用之前,否则您de艰苦de工作在调用htmlspecialchars()后将付之东流.
在经过转换之后,查找HTML相关代码将是替换过de,如双引号”将成为”
nl2br()函数将回车换行符转换为<br>标记,也要在htmlspecialchars()之后.
当转换[links=""] 到 <a href=”">, 您必须确认提交者不会插入javascript脚本,一个简单de方法去更改[link="javascript 到 [link=" javascript, 这种方式将不替换,只是将原本de相关代码显示出来.
outputlib.php
在浏览器中调用test.php,可以看到format_output() de使用情况
正常deHTML标记不能被使用,用下列de特殊标记替换它:
- this is [b]bold[/b]
- this is [i]italics[/i]
- this is [link="http://www.phpbuilder.com"]a link[/link]
- this is [anchor="test"]an anchor, and a [link="#test"]link[/link] to the anchor
[p]段落
[pre]预先格式化[/pre]
[indent]交错文本[/indent]
这些只是很少de标记,当然,您可以根据您de需求随意加入更多de标记
Conclusion
结论
这个讨论提供安全显示用户输入de方法,可以使用在下列程序中
留言板
用户建议
系统公告
BBS系统