综述:编写邮件系统或邮件列表程序是PHP应用的一个大的分支,既管PHP提供了简单的用于发email的函数,但在实际应用中,会涉及到发送带附件的邮件、测试用户输入的email地址的有效性,尤有必要用专门的章节来讲述。
MIME是什么?
MIME表示多用途Internet邮件扩允协议。MIME扩允了基本的面向文本的Internet邮件系统,以便可以在消息中包含二进制附件。
RFC822在消息体的内容中做了一点限制:就是只能使用简单的ASCII文本。所以,MIME信息由正常的Internet文本邮件组成,文本邮件拥有一些特别的符合RFC822的信息头和格式化过的信息体(用ASCII的子集来表示的附件)。这些MIME头给出了一种在邮件中表示附件的特别的方法。
MIME信息包含了哪些东西?
一个普通的文本邮件的信息包含一个头部分(To: From: Subject: 等等)和一个体部分(Hello Mr.,等等)。在一个符合MIME的信息中,邮件的各个部分叫做MIME段,每段前也缀以一个特别的头。MIME邮件只是基于RFC 822邮件的一个扩展。然而它有着自已的RFC规范集。
头字段
MIME头根据在邮件包中的位置,大体上分为MIME信息头和MIME段头,MIME信息头指整个邮件的头,而MIME段头只每个MIME段的头。
MIME信息头有:
MIME-Version:
这个头提供了所用MIME的版本号。这个值习惯上为1.0。
Content-Type:
它定义了数据的类型,以便数据能被适当的处理。有效的类型有:text,image, audio,video,applications,multipart和message。注意任何一个二进制附件都应该被叫做application/octet-stream。这个头的一些用例为:image/jpg, application/mswork,multipart/mixed 。
Content-Transfer-Encoding:
它说明了对数据所执行的编码方式,客户/MUA将用它对附件进行解码。对于每个附件,可以使用7bit,8bit,binary ,quoted-printable,base64和custom中的一种编码方式。7bit编码是用在US ASCII字符集上的常用的一种编码方式。8bit 和binary编码一般不用。对可读的标准文本,如果传输要经过对格式有影响的网关时对其进行保护,可以使用quoted printable 。Base64是一种通用方法,在需要决定使用哪一种编码方法时,它提供了一个不用费脑子的选择;它通常用在二进制,非文本数据上。注意,任何非7bit 数据必须用一种模式编码,这样它就可以通过Internet邮件网关。
Content-ID:
如果Content-Type是message/external-body或multipart/alternative时,这个头就有用了。
Content-Description:
这是一个可选的头。它是任何信息段内容的自由文本描述。描述必须使用us-ascii码。
Content-Disposition:
这是一个试验性的头,它用于给客户程序/MUA提供提示,来决定是否在行内显示附件或作为单独的附件。
MIME段头(出现在实际的MIME附件部分的头),除了MIME-Version头,可以拥有以上任何头字段。如果一个MIME头是信息块的一部分,它将作用于整个信息体。例如,如果Content-Transfer-Encoding显示在信息(整个信息)头中,它应用于整个信息体,但是如果它显示在一个MIME段里,它"只能"用于那个段中。
如何创建符合MIME的信息?
最简单的MIME信息
这个信息没有任何段,即没有附件。但是它有必要的头。
From: php@php.net
To: 'Alex (the Great)' <alex@greece.net>
Subject: Bucephalus
MIME-Version: 1.0
Hello Alexander,
How's Bucephalus doing?
这只是一个简单的拥有MIME头的符合RFC-822 的信息(文本邮件)。需要注意的是Content-Type头默认为Content-Type: text/plain;charset='us-ascii'。
下面是一个更为复杂的例子:
From: 'Alex (the Great)' <alex@greece.net>
To: php@php.net
Subject: re: Bucephalus
MIME-Version: 1.0
Content-Type: image/jpg;
name='buce.jpg'
Content-Transfer-Encoding: base64
Content-Description: Take a look at him yourself
<……base64 encoded jpg image of Bucephalus……>
如果想发送多个附件,并且类型也不统一,怎么办?这就是我们将要讨论的"多部分信息"。
多部分信息(Multipart Messages)
这个概念允许在一封邮件中发送多条项目。例如,假设Alexander想要给php@php.net发送一封他的马的照片的邮件,同时还附带有马的家族图谱及精彩的说明。这样一个简单的要求没有多部分消息的概念是无法被满足的。在这种情况下,我们创建了一个使用Content-Type的信息头的封装来支持邮件的不同部分,以便收信人得到图片,家族图谱和精彩的说明。
Content-Type 头现在拥有一个"multipart"的值,它表示这是一个完整的邮件信息并且这个头只封装了信息。而且它还有一个"mixed"的子类型(例如图片和文本文件是不同的类型)。
让我们看一下:
From: 'Alex (the Great)' <alex@greece.net>
To: php@php.net
Subject: re: Bucephalus
MIME-Version: 1.0
Content-Type: multipart/mixed;
boundary="XX-1234DED00099A";
Content-Transfer-Encoding: 7bit
This is a MIME Encoded Message
--XX-1234DED00099A
Content-Type: text/plain; charset=us-ascii
Content-Transfer-Encoding: 7bit
Hi PHP,
Attached you will find my horse, Bucephalus', pedigree chart and photo
Alex
--XX-1234DED00099A
Content-Type: image/jpg;
name="buce.jpg";
Content-Transfer-Encoding: base64
Content-Description: "A photo of Bucephalus"
<.....base64 encoded jpg image of Bucephalus...>
--XX-1234DED00099A
Content-Type: application/octet-stream;
name="pedigree.doc"
Content-Transfer-Encoding: base64
Content-Description: "Pedigree Chart of the great horse"
<.....base64 encoded doc (pedigree.doc) of Bucephalus...>
--XX-1234DED00099A--
让我们来看一下其中各个部分的含义:
1)、在MIME信息头中的Content-Transfer-Encoding,为"7bit"。因为Content-Type为multipart/mixed,编码应该是7bit,8bit或二进制中的一种, 7bit是一种广泛使用的格式。
2)、象这样一条信息包含了多种信息。客户程序是如何知道JPG图片,文档和普通文本之间的区别呢?在Content-Type后面有一个boundary="XX-1234DED00099A"参数。这个值用来分离邮件中的不同部分。它叫做MIME边界标记。边界标记的值必须尽可能的唯一,以免在超出邮件范围时发生混乱。
3)、"警告"信息("This is a MIME Encoded Message")在那里是为了让不符合MIME的客户程序能够把它显示给用户,否则他们就不理解一个空白邮件是什么意思。
4)、现在,回到边界标记。如果你观察这个简单的邮件,会发现边界标记(XX-1234DED00099A在每一个分都出现了,也就是,在每部分之间都使用了一个边界标记,然而,每个边界标记都以两个连接符开始。很重要的一点需要注意的就是在最后一个MIME段的后面,边界标记不仅仅以那两个边接符作为开始,同时也以它俩作为结束。这一点一定不能忘记,因为它定义了邮件的范围。
5)、让我们看一下前两个MIME段:
第一段是普通文本信息,因此Content-Type为text/plain,并且编码为7bit(我们也可以省略它,因为如果不指明它也会默认为如此)。
第二个就是JPEG图片。相应的表示为Content-Type: image/jpg。name="buce.jpg"(出现在Content-Type的后面,称之为参数),指出了文件的名字;它就是可以在客户程序中看到的附件的名字。如果不给出name="buce.jpg" ,描述字段(如果给出)将作为附件的名字显示出来 。
6)、注意JPEG 图片可以在邮件件中被显示出来,如果客户程序可以显示行内附件。或者,你可以向客户程指明你想如何显示附件。例如,如果存在Content-Disposition: attachment头,JPEG图片将被显示为一个附件图标。
如何创建和实现MIME邮件类?
现在让我们用PHP创建和实现一个MIME邮件类。这个MIME类必须能够:
1、增加附件
2、对每一个独立的请求,对所附的数据进行编码
3、创建MIME段/头
4、生成一个包含MIME段/头的完整的邮件
5、将整个邮件作为字符串返回
6、用本地的邮件处理程序进行发送(或选择调用一个SMTP邮件处理程序)
这个类叫做MIME_mail。
<?php
class MIME_mail {
var $to;
var $from;
var $subject;
var $body;
var $headers = "";
var $errstr="";
var $base64_func= ''; // 如果未指定使用PHP的base64函数
var $qp_func = ''; // 此时为空
var $mailer = ""; // 将其设为有效的邮件对象的名字
?>
这里有一些公共处理的变量(也就是,可以在脚本中直接操纵的变量)。这些变量中的大部分都是自说明的。$headers包含了可选的想要发送给邮件处理程序的头信息。$errstr 是一个包含可读错误字符串的变量,它可以用在调用脚本中。
$base64_func和$qp_func是"函数处理器",用户可以进行定制。缺省地,它们被设为空串。对于$base64_func,一个空串意味着我们将使用PHP内置的base64_encode()函数 。Quoted Printable可以通过$qp_func被处理。在PHP中没有内置的quoted-printable 编码函数(然而,安装了imap则可以使用imap_qprint())。在这篇文章中我们将不再讨论quoted_printable方法。
<?php
//私有:
var $mimeparts = array();
?>
$mimeparts是一个内部数组,包含了邮件信息中各自独立的符合MIME段。请不要在这个类(或派生类)之外操纵它和其它的私有方法/变量。
<?php
// 构造函数
function MIME_mail($from="", $to="", $subject="", $body="", $headers = "")
{
$this->to = $to;
$this->from = $from;
$this->subject = $subject;
$this->body = $body;
if (is_array($headers)) {
if (sizeof($headers)>1) $headers=join(CRLF, $headers);
else $headers=$headers[0];
}
if ($from) {
$headers = preg_replace("!(from: ?.+?[ ]? )!i", '', $headers);
}
$this->headers = chop($headers);
$this->mimeparts[] = "" ; //增加位置0
return;
}
?>
我们拥有对象的构造函数,它使用"from"和"to"邮件地址,主题和邮件体和头作为参数。对于邮件体部分,可以给出你将可能输入的正常邮件。最后一个参数是可选的(用户自定义)头。例如,X-Mailer: MyMailer_1.0。请注意$headers可以是一个数组,包含了将要发给邮件发送程序的不同的头,或者只是某个特别头的容器。你不能在$headers参数中发送From: 头,如果它被找到,这部分将自动被去掉。你可以象下面使用多个头:array("X-Mailer: MYMailer_1.0", "X-Organization: PHPBuilder.com")。
$mimeparts用一个空项(索引0)创建,在后面我们将看到这样用的道理。
我们将MIME信息头的生成,MIME段头的生成和最终的邮件消息的生成分成几个模块。方法的实现是直接从我们前面遇到的MIME基础而来的。
<?php
function attach($data, $description = "", $contenttype = OCTET, $encoding = BASE64, $disp = '') {
if (empty($data)) return 0;
if (trim($contenttype) == '') $contenttype = OCTET ;
if (trim($encoding) == '') $encoding = BASE64;
if ($encoding == BIT7) $emsg = $data;
elseif ($encoding == QP) $emsg = $$this->qp_func($data);
elseif ($encoding == BASE64) {
if (!$this->base64_func) $emsg = base64_encode($data);
else $emsg = $$this->base64_func($data);
}
$emsg = chunk_split($emsg);
//检查是否content-type是text/plain并且如果没有指定charset,追加缺省的CHARSET
if (preg_match("!^".TEXT."!i", $contenttype) && !preg_match("!;charset=!i", $contenttype)) $contenttype .= ";
charset=".CHARSET ;
$msg = sprintf("Content-Type: %sContent-Transfer-Encoding: %s%s%s%s",
$contenttype.CRLF, $encoding.CRLF,
((($description) && (BODY != $description))?"Content-Description: $description".CRLF:""),
($disp?"Content-Disposition: $disp".CRLF:""),
CRLF.$emsg.CRLF);
BODY==$description? $this->mimeparts[0] = $msg: $this->mimeparts[]= $msg ;
return sizeof($this->mimeparts);
}
?>