Hi Hi

1) XML 들어가기- 문서만들기

 

 XML은 HTML보다 훨씬 더 엄격한 규칙을 가지고 있다. XML처리기가 XML문서가 완벽히 이해하지 못하면 어떠한 처리도 하지 않기 때문이다.

때문에 XML 문서들은 잘 구성되어야 하며, 유효해야 한다는 두 가지 제한조건이 있다.

▣ W3C (World Wide Web Consortium) 
 -  WWW (World Wide Web)에 관심을 갖고 있는 여러 회원들이 모인 하나의 그룹이다.

그렇다면 W3C는 웹 규격을 어떻게 구성하고 있을까 ? 웹 규격은 www.w3c.org에 HTML 형식으로 이들 표준이 게시 된다. 

어떤 문서가 잘 구성된 XML 문서인가 ?

-"well-formed"의 조건
자체적으로 라벨로 구성되는 산출물 규칙을 따라야 한다.
이 규격에 주어진 잘 구성된 문서 제한조건을 만족시켜야 한다.
내서의 참조할 수 있는 엔티티들을 잘 구성되어야 한다.

'엔티티'란 ? XML 문서의 각 부분이며, 이들은 텍스트나 데이터를 저장할 수 있는 부분이다. XML에서 데이터 저장 단위로 알려진 일반적인 방식이라고 할 수 있다.

<?xml version="1.0" standalone="yes"?>
<?xml> 선언에서는 이 문서가 XML로 작성되어 있다. 현재 사용할 수 있는 1.0 버전을 사용하고 있다.



<?xml version="1.0" encoding="UTF-8"?>

<DOCUMENT>
 <COUSTOMER>
 </COUSTOMER>
 
 <COUSTOMER>
 </COUSTOMER>
 
 <COUSTOMER>
 </COUSTOMER>

</DOCUMENT>

<DOCUMENT> 안에 <COUSTOMER> 라는 고객란을 만들 수 있다.



마크업과 문자 데이터
XML 문서는 마크업과 데이터로 구성된다.

문서의 마크업은 그 구조를 정의한다 .
-시작 태그, 종료 태그, 빈 요소 태크, 엔티티 참조, 문자 참조, 주석, DTD, 처리문 등을 포함한다.

문자데이터는 문서의 모든 텍스트를 말한다.

 <?xml version="1.0" encoding="UTF-8"?>
<DOCUMENT>
 <GREEING>

  "Hello "
 </GREEING>
 <MESSAGE>
  "Welcome to the "
</DOCUMENT>
 </MESSAGE>
예제를 보면 , 태그는 무조건 "<" ">"욿 끝나게 된다. 파란색으로 되어있는 것들은 모드 마크업이다.
마크업을 제외하고 보면 "Hello"와 "Welcome to the" 의 경우 문서데이터로 볼 수 있다.

마크업이 반드시 < 와 > 를 필요로 하지는 않는다. 일반적인 엔티티 참조의 경우에는  &로 시작하여 ;으로 끝날 수도 있으며, DTD에서 사용하는 파라미터 엔티티 참조의 경우에는 %로 시작하여 ;으로 끝나기도 한다.


공백 

두 문서는 동일하다.


프폴로그
-문서의 맨 앞에 나오거 된다. XML 선언, 주석, 처리문, 공백과 문서 형식의 선언등에 대한 내용을 포함한다.
 <?xml version="1.0" encoding="UTF-8"?>  버전. 유니코드
<?xml-stylesheet type="text/css" href="greeting.css"?> XML 선언. 외부 CSS 참조
<!DOCTYPE DOCUMENT [ ->DTD 선언.
<!ELEMENT DOCUMENT (CUSTOMER)*>
]>


XML 선언
-반드시 XML선언으로 시작해야 한다.

<?xml version="1.0" standalone="yes" encoding="UTF-8"?>

version : xml 버전으로, 현재는 아직 1.0만 사용할 수 있다.
standalone : 문서가 아무런 외부 엔티티를 참조 하지 않는다면 "yes"로 설정하며 , 생략이 가능 하다.
encoding : 문서에 대한 언어 인코딩으로, 기본값은 "UTF-8" 이며 생략이 가능하다.

주석문
-설명하고자 하는 내용의 노트를 문서에 포함하고자 할 때 사용
<!--설명할 내용--> 로 주석을 사용한다.


 <?xml version="1.0" encoding="UTF-8"?>
<DOCUMENT>
 <!-- 주석사용-->
 <GREEING>
 <!--여기서부터 인사말-->
 </GREEING> 

-주석문은 XML 선언문 이전에 올 수 없다.
-마크업 내부에 주석문을 입력할 수 없다.
 EX) <DOCUMENT><!-- 주석사용-->


처리문
-
XML 처리기에 전당하는 명령어이다. <?로 시작하여?>로 끝난다.


태그와 구성요소
마크업을 사용하여 구조를 작성하게 되며, <> 시작태그와 </>종료 태그로 구성된다.

XML에서 부적합한 태그들
<2003DOCUMENT>
<.document>
<Record Number>
<customer*name>

빈 구성 요수는 시작과 종료 태그가 아닌, 하나의 태그만을 사용한다.
예를 들면, <GREETING TEXT = "Hello" /> 시작과 종료를 사용하지 않는다.

루트 구성요소
-다른 모든 구성 요소들을 포함하는 하나의 구성 요소가 있어야한다.
  다른 요소를 포함하는 구성 요소를 루트(root) 요소라고 한다.

 <?xml version="1.0" encoding="UTF-8"?>
<DOCUMENT>
 <CUSTOMER>
  <NAME>
   <LAST_NAME>Smith</LAST_NAME>
   <FIRST_NAME>Sam</FIRST_NAME>
  </NAME> 
  <DATE>October 15, 2011</DATE>
 </CUSTOMER>
</DOCUMENT>
<DOCUMENT>가 루트 요소이다.




잘 구성된 문서 구조 만들기
1. 문서는 XML 선언으로 시작해야 한다.
<?xml version="1.0" encoding="UTF-8"?>

2. 하나 이상의 구성요소 포함하기
<?xml version="1.0" encoding="UTF-8"?>
<DOCUMENT>
 <GREEING>
  "Hello "
 </GREEING>
</DOCUMENT>

3. 비어 있지 않은 요소에는 시작과 종료 태그를 사용한다.
<?xml version="1.0" encoding="UTF-8"?>
<DOCUMENT>
<GREEING>
"Hello "
</GREEING>
</DOCUMENT>

4. 내용이 없는 태그는 />로 끝난다.
<?xml version="1.0" encoding="UTF-8"?>
<DOCUMENT>
<GREEING TEXT "Hello " />
</DOCUMENT>

5. 루트 요소는 반드시 다른 모든 요소를 포함해야 한다.
<?xml version="1.0" encoding="UTF-8"?>
<BOOKS>
 <BOOK>
 ...
 </BOOK>
 <BOOK>
 ...
 </BOOK>
</BOOKS>

6.구성요소들을 제대로 중첩시켜야 한다.
  XML 처리기에는 종료 태그인 </GREETING>이 나오기 전에 <MESSAGE>태그를 만나게 되면 문제가 발생한다.

7.고유한 속성 이름을 사용한다.
<PERSON LAST_NAME="Wooster" LAST_NAME="Jeeves">
<PERSON LAST_NAME="Wooster" last_name="Jeeves">
 
 XML에서는 대.소문자를 구별하기 때문에, 이와 같이 대.소문자가 바뀐 경우에는 다른 이름으로 인식한다.


8. 정해져 있는 5개의 엔티티 참조만을 사용할 수 있다.
&amp; : & 문자
&lt; : < 문자
&gt; : > 문자
&apos; : ' 문자
&quot; : " 문자


'' 카테고리의 다른 글

HTML 폰트, 글꼴 설정  (0) 2011.11.02
XML 스키마 만들기  (0) 2011.07.14
1) XML 들어가기- 문서만들기  (0) 2011.07.03