Skip to Main Content

문헌검색을 위한 효과적 방법

검색 전략의 계획

연구 주제와 검색 수단을 결정한 다음에 이제 연구 주제(질문)를 사용가능한 검색으로 연결시켜야 한다. 이렇게 함으로써 연구자는:

  • 적합한 연구를 발견하고 잘못된(부적합한) 결과 출력의 가능성을 최소화하고
  • 장기적 관점에서 시간을 절약하며
  • 검색의 전 과정에서 목표와 계획에 충실하게 하며
  • (필요시) 반복하고 결과를 수정하며
  • 미래의 연구자들이 본인의 연구를 참조하는 데에 도움을 준다.

처음으로 연구 주제를 살펴보고자 한다면, 검색 전략은 초기에 상당히 느슨할 수 있다. 다음으로 검색 용어를 살펴보고 이에 따라 검색 전략을 새로이 수정할 수 있다. 검색 전략을 개발해 감에 따라 기록하고, 검색의 각 단계에서 최종 결과를 캡쳐(capture)해 두어야 한다.

식품 분야에서 정보 검색은 그 넓은 범위와 내용 색인 방식 때문에 복잡한 과정임을 유념하여 한다. 결과적으로 식품 자료를 위해서 만들어지지 않은 데이터베이스에서 식품 주제를 검색할 때에는 상당한 수준의 노이즈(noise)가 발생된다. 성공적인 검색 전략을 계획하는 데에는 데이터베이스, 그 범위, 색인 및 구조에 대한 지식이 포함된다.


검색 전략의 구성
우수한 검색 전략은 다음을 포함한다:

  • 핵심 개념과 유의한 용어들
  • 키워드(keyword)나 주제어
  • 대체 키워드
  • 개념을 바르게 연결시키는 데에서의 주의
  • 초점있는 검색이 되도록 검색 결과의 정기적 평가
  • 최종적 검색 전략의 자세한 기록. 개시 이후에 발행된 새로운 문헌을 찾을 수 있도록 문헌검토의 마지막에 다시한번 검색을 수행할 필요가 있다.

검색 matrix


 


검색 matrix의 사용은 브레인스토밍과 단어 수집에 도움이 된다.  검색 matrix를 채우기 위해서는:

  • 검색에서 주된 개념을 확인해야 하고
  • 다른 박스들(boxes)를 채우기 위하여 두개의 병행 전략을 사용한다:
    • 용어를 가지고 초기 검색을 수행하고, matrix에 첨가할 단어를 얻기 위해서 타당한 결과의 초록과 주제 용어(사용 데이터베이스에 따라서 기술어, 키워드, 의학주제표목(MeSH headings), 혹은 thesaurus 용어로 호칭)를 살펴본다.
    • 보다 넓은 범위와 보다 좁은 범위의 적당한 용어에 대해서 데이터베이스 thesaurus (관련 용어 모음) 구조를 탐색한다.

: 검색 matrix의 모든 박스를 다 채울 필요는 없다.

여기서 주어지는 예를 가지고 검색을 수행해보면 몇번의 검색 과정이 필요하고, 이에 따라 검색 전략을 개선 향상시킬 수 있을 것이다. 주어진 예의 연구 주제에 대한 검색에서는:

  • 넓은 범위의 어떤 용어들은 너무 범위가 넓어서 돼지고기(pork)와 닭고기(chicken )까지를 포함한 부적합한 결과가 많이 보이고
  • 소고기 추출물(beef extract)을 포함하는 검색은 소고기(beef)만을 사용해도 모두 포함되므로, 좁은 범위의 어떤 용어들은 불필요하다.

수정된 matrix 확인(검색 실행 후)!


수정 보완된 matrix에서 용어의 수정과 함께, Boolean 연산자에 의한 용어의 상호 연결을 보여준다. 같은 개념(열)의 다른 형태는 OR로 연결되고, 각각의 다른 개념은 AND로 연결된다.

검색 도구

Boolean 연산자는 데이터베이스나 검색 엔진에게 입력하는 용어가 서로 어떻게 관계될 지를 지시한다.

Boolean 연산자는 데이터베이스나 검색 엔진에게 입력하는 용어가 서로 어떻게 관계될 지를 지시한다.

같은 개념을 표현하는 상이한 용어들을 연결하기 위해서는 OR 사용한다. 많은 검색 인터페이스에서 다음과 같이 괄호 안에 OR를 넣기도 한다: (safe OR “food safety” OR decontamination OR contamination OR disinfect*). 이들은 합쳐져서 검색에서 하나의 식품안전(food safety)으로 통합된다.

다른 개념들을 연결시키기 위해서는 AND 사용한다. (safe OR “food safety” OR decontamination OR contamination OR disinfect*) AND (beef OR “cattle carcasses”)을 입력하게 되면데이터베이스는 두 개념을 함께 포함하는 결과를 나타내게 된다.

NOT은 특정 단어를 포함하는 결과를 제외시킨다. NOT의 사용에는 주의가 필요하다. 제외된 용어가 예상하지 못한 방법으로 적용되어 모르는 사이에 결과가 누락될 수 있다.


Boolean 연산자의 사용에 대한 추가정보[영어]: Research Basics: Using Boolean Operators to Build a Search (ifis.org)


주어진 예의 matrix에 의한 데이터베이스 검색은 다음과 같다:

("food safety" OR safety OR decontamination OR contamination OR disinfection) AND (thaw* OR defrost* OR "thawing medium") AND ("sensory quality attributes" OR "sensory perception" OR quality OR aroma OR appearance OR "eating quality" OR juiciness OR mouthfeel OR texture OR "mechanical properties" OR "sensory analysis" OR "rheological properties") AND (beef OR "cattle carcasses")

같은 개념을 나타내는 단어와 철자에서의 차이를 확인하는 데 thesaurus 용어들이 도움을 주지만, 같은 용도로 데이터베이스에서 이용되는 다른 기능도 활용할 수 있어야 한다. 이 점은 thesaurus가 식품 과학에 맞추어 있지 않은 데이터베이스에서는 특히 중요하다.

  • “food safety” 에서와 같이 둘 이상의 단어를 따옴표 안에 두는 구절 검색(phrase search)은 이 단어들이 하나의 영역(즉, 제목, 초록 혹은 주제 목록)에 함께 해당 구절로서 나타나는 조건을 지정한다. 필요한 개념을 표현하기 위해 단어로 결합된 검색구의 사용은, 단어들이 따로 떨어져서 나열된 가짜 결과가 출력되는 것을 방지한다.
  • 어떤 데이터베이스에서는 서로 가까이 있을 필요가 있는 단어들을 지정할 수 있게 하는 근접 검색도 가능한다. 예를 들면, ripening N5 cheese를 검색에서 입력하면 ripening cheese 사이에 최대 5 단어를 포함하는 결과를 보여준다. 즉, cheese ripening의 결과와 함께 ripening of semi-hard goat cheese의 결과도 보여준다.

검색구 사용과 근접 검색에 대한 추가 정보는 다음에서 얻을 있다 [영어]: Proximity searching, phrase searching, and Boolean AND: 3 techniques to focus your literature search (ifis.org)


주의: 근접 검색의 표시는 데이터베이스에 따라 다르다. 어떤 곳에서는 N에다 숫자를 붙여 쓰고, 어떤 곳에서는 NEAR, ADJ, W 등을 사용한다. 데이터베이스의 도움말(help) 부분을 확인하여 올바른 표시를 사용하여야 한다.

단어 절단이란 단어의 시작을 입력하면서 나중에 표시(주로 *)를 덧붙이는 것을 말한다. 이 표시는 데이터베이스로 하여금 입력한 문자로 시작하는 모든 단어에(입력 단어만도 포함하여) 해당하는 결과를 출력시킨다. 뒤이어 여러 철자 조합으로 이루어진 단어로서 표현되는 개념을 추출하는 쉬운 방법이다.

경우에 따라서 부적합한 결과를 피하기 위하여 절단하는 위치를 조정할 필요가 있다. 다음에서 결과에서 nutri*와 nutrit* 차이를 알 수 있다.

nutri* nutrit*

nutria     

nutritious     

nutrition       

nutritional       

nutritionally  

nutricereals    

nutrikinetics

nutritionists  

nutrative  

nutrient 

nutrients

nutrigenetics

nutrigenomic

nutrigenomics

등등

nutrition 

nutritious           

nutritional     

nutritionally  

nutritionists  

nutritive  

와일드카드 표시를 함으로써 유사한 철자를 포함시킬 수 있다. 어떤 데이터베이스에서 organi?ation을 입력하면 organisation organization에 모두에 해당되는 결과를 출력하고, flavo#rflavorflavour에 대한 결과를 제공한다.


주의: 단어 절단의 표시는 주로 *이지만, $ !이 사용되기도 한다. 와일드카드 표시도 데이터베이스 마다 다르다. $?가 때때로 사용된다. 올바른 표시의 사용을 위해서 해당 데이터베이스의 도움말(help) 부분을 항상 확인하여야 한다.


검색의 구성에서 가능한 모든 도구를 결합하여 사용할 수 있다. “Brewer* yeast”의 입력으로 검색구 사용과 절단 검색을 사용하면, 문헌에서 사용된 brewer yeast, brewer’s yeast brewers yeast 3가지 모든 조건에 대한 결과를 얻을 수 있다.

최상의 방법!

최상의 방법 제안:  단어 절단과 와일드카드의 표시를 맞게 사용하기 위해서 해당 데이터베이스의 도움말 부분을 확인하여야 한다. 

수작업 검색(handsearching)

수작업으로 데이터베이스 검색을 보완하는 것은 좋은 방법이다. 이는 데이터베이스 검색이 놓친 연구를 발견하기 위하여 학술잡지와 학술대회의 목차를 직접 눈으로 살펴보는 과정이다. 또한 데이터베이스 검색에서 발견된 적합한 논문의 참고문헌 목록을 살펴보는 것도 포함된다. 이렇게 하는 것이 좋은 세가지의 이유가 있다:

  • 수작업 검색에서 사용한 데이터베이스에서 이전의 검색에서 발견되지 못한 추가적인 논문들을 확인한다면, 검색 기록을 다시 살펴보아서 검색 전략의 수정이 필요한지를 알 수가 있다. 아마도 검색 문자열에서 유용한 비슷한 개념을 생략했을 수도 있다.
  • 비록 검색 문자열이 매우 좋았더라도, 연구에 밀접하게 관련된 초록이나 기록에서 검색의 해당 용어가 포함되어 있지 않아 쉽게 발견되지 못했을 수도 있다.
  • 참고문헌 목록이 사용 데이터베이스에서 색인되기 전에 발표된 논문을 보여줄 수도 있다.

수작업 검색에서는 주제 영역에 확실히 해당되는 학술잡지와 학술대회 발표논문집을 찾아서 목차를 확인하게 된다. 가끔 부록자료나 교신서(letter)에 있는 중요 정보가 데이터베이스의 색인 과정에서 누락되기도 한다.

대학 도서관은 이 과정을 빠르게 할 수 있는 도구를 구독하여 제공하기도 한다. 예로서 Zetoc(학술대회 발표논문집과 학술잡지 목차 제공) Browzine(학술잡지만 포함)가 있다학술잡지의 웹사이트에서도 지난 호와 현재 호의 목차를 확인할 수 있다.

수작업 검색은 가치가 있으나 노력이 많이 드는 작업이므로, 시간을 어디에 쓸 것인지에 대해 신중히 판단해야 한다.

최상의 방법!

 최상의 방법 제안:   검색 전략을 평가하기 위해 동료, 교수, 도서관 사서에게 물어보는 것이 매우 도움이 된다. 특히 연구자가 해당 주제를 처음 접한다면 더욱 그렇다. 이렇게 함으로써 문헌 검색에 신뢰성을 부여하고 가능한 최상의 검색을 하고 있다는 확신을 가질 수 있다.


 최상의 방법 제안:   검색의 자세한 기록을 저장하여야 한다. 이렇게 함으로써 과제를 제출하기 전에 간단한 추가 검색 수행만으로도 과제 개시 이후에 새로운 연구가 더 발표되었는지를 확인할 수 있다. 이를 위한 방법을 다음을 정리해 두는 것이다:

  • 검색이 이루어진 곳
  • 정확한 검색 내용
  • 검색 수행 날짜
  • 결과의 수

이런 모든 정보를 보관함으로써 다시 검색을 수행할 때 새로운 결과를 잡아내는 지를 쉽게 확인할 수 있다.


 최상의 방법 제안:  연구를 학술잡지에 발표하려고 한다면, 검색 결과에서 자주 나타나는 학술잡지를 영향력 높은 연구주제의 출판처로 고려한다.