2007년 7월 24일 화요일

새로운 기술을 습득하는 방법

새로운 기술을 습득하는 방법에는 여러가지가 있지만 요즘 시대에도 그리 바뀐거 같지는 않다.
과거의 습득 방법이 책과 스승에게 배웠다고 하면 지금도 역시 책과 스승이다.
하지만 스승이라는 존재가 과거에는 주변의 사람에 국한 되었다면, 지금은 인터넷을 통한
모르는 사람의 글과 동영상강좌도 스승이라는 점이다.

사실 이것은 굉장히 큰 변화로써 과거에는 지식이 위에서 아래로만 흐르고 각각의 등급(?)에 맞는
지식을 습득했다면 이제는 인터넷이란 것을 통해서 누구나 고급지식에 접근이 가능해졌고
또한 그것을 습득해서 자신의 것으로 만들 수 있다는 점이다.

복잡한 알고리즘의 내부에는 그것을 도출한 수학공식이 있기 마련이며, 그 수학공식에는
우리가 쉽게 접하는 사칙연산을 기반으로 한 수식들이 있다.(모든 공식은 사칙연산으로 표현될껄?)

파고 들면 들어갈수록 그 내부에는 간단한 진리들이 복잡하게 톱니바퀴처럼 얽혀서 유기적인 흐름을
이루고 있는것이다.

그렇다면 기술적인 관점에서의 새로운 기술을 습득하는것도 관계가 있을까?
저렇게 원자성의 기준은 제쳐두고 기술들의 연결과 그 필요성을 알아보는데서
새로운 기술의 습득을 시작하는것이 좋지 않을까 싶다.

예로 들어 언어의 표현을 위해 우리는 인코딩을 한다.
대표적인 영어 인코딩의 방식에는 IBM의 EBDIC과 ASCII방식등이 있고 기타 국가별, 언어별로의 서로 다른 인코딩 방식들이 있으며 이것은 서로 호환이 되지 않는 방식으로 설계가 되어있다.

그렇다면 여기서 유니코드의 필요성을 느끼는가? 느끼지 못하는가의 차이는 이러한 인코딩방식이
나뉘어 있는것을 어떠한 시각으로 보느냐에 따라서 달라진다.

해당 인코딩방식으로만 작업을 하며 그 인코딩 방식 이외에는 사용하지 않는다면 불편을 느끼지
않을 수도 있다. 하지만 직업적인 특성상 여러 언어로 작업을 하게 되고 또한
그때마다 인코딩방식이 달라서 제대로 표현되지 못한다면 사용자는 각각의 인코딩에 알맞는
디코딩 옵션을 매번 사용해야 할 것이며 이것을 이용한 정보의 교류 역시 해당 인코딩을 사용하는
지역이나 디지탈 기기에서만 가능할 것이다.

이는 동양의 언어와 서양의 언어에서 그 차이가 확연히 드러난다.
동양 한자 문화권에서의 언어 표현은 2바이트 문자이여 한 글자를 나타내는데 2바이트(16비트)가 필요하다. 하지만 영어권에서는 한글자에 1바이트(8bit)만 있으면 된다.
그렇다면 한글로 씌여진 글씨는 영어 문화권의 인코딩방식에 적합하지 않아서 볼수가 없다.
(반대는 된다 -.-)

이러한 정보들의 교류를 위해서 비록 내용을 알 순 없지만 무의미한 기호들이 도배되어 있는
디코딩이 제대로 되지 않은 (소위 인코딩이 깨졌다라는 표현) 글을 보게 되게 되고
이는 정보의 교류라는 측면에서 심각한 문제가 된다.

따라서 이것을 극복하기 위한 방법으로 유니코드라는것을 만들어냈다. (http://www.unicode.org)

위의 글을 보면 유니코드라는것을 다루는데 있어서 만들게 된 이유를 설명해 놓았다.

기타 대표적인 예를 들면
lagacy라 일컬어지는 메인 프레임과 유닉스 시스템의 연결을 위해 CORBA가 등장했고
C++의 시스템 종속성과 메모리 관리등의 어려움을 어느정도 해소했다는 (사용자입장에서) JAVA
HTML의 한계를 넘기 위한 ECMA SCript(java script) 와 CSS
데이타 간의 호환성을 높여주기 위한 XML 과 XML Database
등등 너무나 많다.

이러한 기술들은 하늘에서 뚝 떨어져서 어느날 갑자기 세상에 등장한게 아니고
다들 그 필요성에서 의해서 서로들간의 연관된 관계를 가지고 등장하게 된 것이다.

따라서 새로운 기술이라고 하더라고 그 시작은 어느날 어디에선가 불편함을 느낀 누군가가 시작해서
기존의 기술을 재가공하고 추가해서 만들어낸것 이므로
그러한 기술을 배움에 있어서 과거의 원천이 되는 기술을 배우고 바뀐점을 습득하며
서로간의 관계를 연상해서 기술의 전체적인 흐름을 알고
그 기술의 이용법을 배우는것이 효과적이라고 생각한다.

2007년 7월 18일 수요일

검색엔진 마케팅과 포탈.

정의는 이전의 포스트에도 있다.
사전적정의는? 다음과 같다

검색 엔진 마케팅 [檢索-, search engine marketing]
본문

검색 도구를 단순한 검색에 그치는 것이 아니라 적극적으로 특정 웹 사이트로의 방문을 유도하여 상품을 구입하게 하는 인터넷 마케팅 전략. 각종 유명 검색 엔진에 등록하거나 검색 결과의 상위 랭킹, 그리고 사용자가 인식하지 못하더라도 광고 효과는 올릴 수 있는 모든 노력들을 통틀어 검색 엔진 마케팅(SEM)이라고 한다.
출처 : 네이버 백과사전

위키피디아에서 정의하는
검색엔진 마케팅


네이버 백과사전의 정의가 짧으니까 저말로 살펴보자
검색도구를 이용해서 사이트로의 방문을 유도해서 .. 방문객을 지지고 볶아서 돈을 번다.
중요한건 저거다..
"돈을 번다!!"

그럼 누가 마케팅을 하느냐.. 돈을 벌려고하는 회사나 개인이 되겠다.
그런데 사실상 국내에서 검색엔진 서비스를 하는 곳을 보자.
국내 페이지 뷰 1위 네이버.. 그 뒤를 이어가는 다음, 파란, 엠파스 등등.. (야후는 파란한테도
졌다면서 -.- )

이곳들은 모두 포탈이고 웹서비스의 all in one을 지향한다..
훗. 말이 좋아 all in one 이지 지들이 다 해먹어서 지들이 돈 다 벌겠다는거다.

머.. 지들도 회사인데.. 돈벌어야지.. 돈벌려면.. -.- 해답은 독점인가??
물론 공정한 판에서 같이 싸우게. 덩치를 줄여라.는 말은 안하겠다.
지들이 잘나서 컷는데.. 도와준거 하나 없는 내가 무슨 저런말을 할 자격이 있겠느냐만은

머랄까.. 검색결과의 공정성은 좀 지켜줬으면 한다.
아니면 아예 인터넷 검색이란 간판 내리고 우리꺼만 보여줄게요~ 라고 해놓고 크롤러 돌리지 말던지
내부검색만 해서 보여준다고 말을 하던지

검색결과의 조작을 통한 수익창출에 대해서는 아주 예전부터 말도 나오고 요즘엔 지쳐서
그냥 당연한듯이 말이 안나온다..

얼마전에 넷중립성에 대한 기사들이 있었다.

스스로가 포탈이고 국내에서 등수놀이 할거면 먼저 가장 처음에 들고 나왔던 검색엔진 서비스부터
정상화 시켜놓고 다른 경쟁을 했으면 좋겠다.

무턱대고 자신들 내부의 블로그, 지식, 카페 등의 결과만 보여주고 회원가입 유도 하기전에
검색서비스부터 정상적으로 해주면 안되겠니 -_-?

검색엔진 마케팅 기초

검색엔진 마케팅.
나름대로의 정의 -
검색엔진의 노출 우선순위를 이용한 마케팅 방법이었지만 근래에는 검색엔진 자체에서 돈벌이로 이용되고 있다.

예 ) 네이버 --> 플러스 검색 , 야후 --> 스폰서샵

-- 기존의 검색 방법 --
크롤러 봇 ( Crawler Bot ) 이 웹사이트를 뒤지면서 HTML안의 특정 태그들을 탐색한다.
1. meta
2. title
3. a href
4. 페이지 전체의 HTML을 제외한 구문
크롤러가 모아온 정보를 인덱서는 차례대로 분석을 하며 각각의 태크별로 분석을 한 후
각각의 페이지들에 맞는 키워드를 할당한다.
키워드의 정의는 해당 페이지 안에서의 단어의 빈도수나 형태소 분석을 통한 문장의 어휘를 기반으로
결정한다.
3. 크롤러는 1의 과정을 반복하는 과정에서 <"a"> 태그의 링크를 따라가면서 분석을 해당 페이지를
분석한다.

-- 구글의 Page Rank system --
레리 페이지(구글 창업자)가 고안한 페이지 랭크라는 개념은 다음의 전제조건이 있다.
쓸모 있고 유익한 페이지 일수록 그 페이지를 링크하고 있는 페이지의 수가 많다.
쓸고 있고 유익한 페이지는 방문자가 많으며 오래 머문다.
1번의 조건은 페이지를 분석하는데 있어서 역링크를 이용한다.
역링크란 해당 페이지를 링크하고 있는 페이지를 말한다.
예 ) 나 -------------> 친구 << 이경우는 순링크 이지만
나 <------------ 친구 << 이경우는 역링크이다.
특정한 키워드에 대해서 "나"를 링크하고 있는 페이지가 많다면(친구가 만다면)
"나"는 아주 유익하며 쓸모 있고 정보의 원천이 될 수도 있다.
하지만 "나" 또한 다른곳의 친구를 엄청 많이 참고하고 있다면 그 친구가 유익하며 정보의
원천인것이다.
이런식으로 나를 링크하는 페이지를 찾는것이다.
그렇다면 당연히 정보의 원천인 페이지는 자신의 사이트중 어느곳을 링크하고 있을것이며 다른곳을
링크하고 있어도 그 페이지를 분석해보면 해당하는 키워드가 아니라면 "나"의 가중치는 높아진다.
이렇게 링크를 거꾸로 탐색을 하며 최상위 페이지를 가려내며 그 페이지에 방문객이 많다면
그 페이지는 검색결과의 제일 처음에 나오는 것이다.
여기서 질문. 방문객이 많은지 어떻게 아나요 -_-??
라는 질문에 대해서는 구글 툴바를 얘기해주고 싶다 구글 툴바를 사용할 시에 자신이 입력하는
키워드가 방문해서 사이트에 머무는 시간과 해당 URL을 구글로 전송해줌으로써 검색의 결과는 더욱
정확해진다.
(요즘엔 구글 검색 결과도 조작해주는 사업체가 있다고 하지만 그나마 믿을만한 검색엔진이다.)
아래의 페이지에서 보다 더 자세한 페이지 랭크 알고리즘을 알 수 있다.
http://www.emh.co.kr/xhtml/google_pagerank_citation_ranking.html