¡Ú ÀÌ Ã¥ÀÇ ±¸¼º ¡Ú
1Àå. ¡®½ÃÀÛÇϱ⡯¿¡¼´Â µö·¯´×ÀÇ ±âÃʸ¦ ¼Ò°³Çϸç, Ãʺ¸ÀÚ´Â ¾îÈÖ¿¡ Àͼ÷ÇØÁú ½Ã°£À» °®°Ô µÈ´Ù. ÀÌÈÄ ÀåÀ» ¼öÇàÇÏ´Â µ¥ ÇÊ¿äÇÑ ¼ÒÇÁÆ®¿þ¾î ÆÐŰÁö ¼³Ä¡¿¡ ´ëÇÑ ³»¿ëµµ ´Ù·é´Ù .
2Àå. ¡®À̹ÌÁö ºÐ·ù¡¯¿¡¼´Â À̹ÌÁö Àüü¿¡ ·¹À̺íÀ» ºÙÀÌ´Â À̹ÌÁö ºÐ·ù ¹®Á¦¸¦ ¼³¸íÇÑ´Ù. À̹ÌÁö ºÐ·ù ±â¼ú¿¡ ´ëÇØ ¹è¿ì°í ¾Ö¿Ïµ¿¹° ºÐ·ù¿¡ ´ëÇÑ µö·¯´× ¸ðµ¨À» ÈÆ·ÃÇÒ ¼ö ÀÖ´Ù. ¶ÇÇÑ Á¤È®µµ¸¦ ³ôÀÌ°í ´Ù¾çÇÑ °í±Þ ¾ÆÅ°ÅØÃ³¿¡ ´ëÇÑ ½Éµµ ÀÖ´Â ³»¿ëÀ» ¹è¿ì°Ô µÈ´Ù.
3Àå. ¡®À̹ÌÁö °Ë»ö¡¯¿¡¼´Â ½ÉÃþ Ư¡(deep feature)°ú À̹ÌÁö ...
´õº¸±â
¡Ú ÀÌ Ã¥ÀÇ ±¸¼º ¡Ú
1Àå. ¡®½ÃÀÛÇϱ⡯¿¡¼´Â µö·¯´×ÀÇ ±âÃʸ¦ ¼Ò°³Çϸç, Ãʺ¸ÀÚ´Â ¾îÈÖ¿¡ Àͼ÷ÇØÁú ½Ã°£À» °®°Ô µÈ´Ù. ÀÌÈÄ ÀåÀ» ¼öÇàÇÏ´Â µ¥ ÇÊ¿äÇÑ ¼ÒÇÁÆ®¿þ¾î ÆÐŰÁö ¼³Ä¡¿¡ ´ëÇÑ ³»¿ëµµ ´Ù·é´Ù .
2Àå. ¡®À̹ÌÁö ºÐ·ù¡¯¿¡¼´Â À̹ÌÁö Àüü¿¡ ·¹À̺íÀ» ºÙÀÌ´Â À̹ÌÁö ºÐ·ù ¹®Á¦¸¦ ¼³¸íÇÑ´Ù. À̹ÌÁö ºÐ·ù ±â¼ú¿¡ ´ëÇØ ¹è¿ì°í ¾Ö¿Ïµ¿¹° ºÐ·ù¿¡ ´ëÇÑ µö·¯´× ¸ðµ¨À» ÈÆ·ÃÇÒ ¼ö ÀÖ´Ù. ¶ÇÇÑ Á¤È®µµ¸¦ ³ôÀÌ°í ´Ù¾çÇÑ °í±Þ ¾ÆÅ°ÅØÃ³¿¡ ´ëÇÑ ½Éµµ ÀÖ´Â ³»¿ëÀ» ¹è¿ì°Ô µÈ´Ù.
3Àå. ¡®À̹ÌÁö °Ë»ö¡¯¿¡¼´Â ½ÉÃþ Ư¡(deep feature)°ú À̹ÌÁö °Ë»öÀ» ´Ù·é´Ù. ¸ðµ¨ ½Ã°¢È, ½Ã°¢Àû ±â´É, ÅÙ¼Ç÷Î(TensorFlow)¸¦ »ç¿ëÇÑ Ãß·Ð, Á¦Ç° °Ë»öÀ» À§ÇÑ ½Ã°¢Àû ±â´É Á¦°ø ¹× »ç¿ë¿¡ ´ëÇÑ ´Ù¾çÇÑ ¹æ¹ýÀ» ÇнÀÇÒ ¼ö ÀÖ´Ù.
4Àå. ¡®°´Ã¼ °ËÃ⡯¿¡¼´Â À̹ÌÁöÀÇ °´Ã¼ °ËÃâÀ» ¼³¸íÇÑ´Ù. ´Ù¾çÇÑ °´Ã¼ °ËÃâ ±â¼úÀ» ¹è¿ì°í À̸¦ º¸ÇàÀÚ °ËÃâ(pedestrian detection)¿¡ Àû¿ëÇÒ ¼ö ÀÖ´Ù. °´Ã¼ °ËÃâÀ» À§ÇÑ ÅÙ¼Ç÷ΠAPI°¡ ÀÌ Àå¿¡¼ Ȱ¿ëµÈ´Ù.
5Àå. ¡®½Ã¸Çƽ ºÐÇÒ¡¯¿¡¼´Â Çȼ¿ ´ÜÀ§·Î À̹ÌÁö¸¦ ºÐÇÒÇÏ´Â °ÍÀ» ´Ù·é´Ù. ºÐÇÒ ±â¹ý¿¡ ´ëÇÑ Áö½ÄÀ» ¾ò°í ÀÇ·á À̹ÌÁöÀÇ ºÐÇÒ ¸ðµ¨À» ÈÆ·ÃÇÒ ¼ö ÀÖ´Ù.
6Àå. ¡®À¯»çµµ ÇнÀ¡¯¿¡¼´Â À¯»çµµ ÇнÀ¿¡ ´ëÇØ À̾߱âÇÑ´Ù. À¯»çµµ ¸ÅĪ(similarity matching)°ú ¾ó±¼ ÀνÄÀ» À§ÇÑ ¸ðµ¨À» ÈÆ·Ã½ÃŰ´Â ¹æ¹ýÀ» ¹è¿ì°Ô µÈ´Ù. ¾ó±¼ Ç¥½Ä(face landmark)À» ÈÆ·Ã½ÃŰ´Â ¸ðµ¨ÀÌ ¼³¸íµÈ´Ù.
7Àå. ¡®À̹ÌÁö ĸ¼Ç¡¯¿¡¼´Â À̹ÌÁöÀÇ Ä¸¼ÇÀ» »ý¼ºÇϰųª ¼±ÅÃÇÏ´Â °ÍÀ» ´Ù·é´Ù. ÀÚ¿¬¾î ó¸® ±â¼ú°ú ÀÌ ±â¼úÀ» »ç¿ëÇØ À̹ÌÁö ĸ¼ÇÀ» »ý¼ºÇÏ´Â ¹æ¹ýÀ» ¹è¿î´Ù.
8Àå. ¡®»ý¼º ¸ðµ¨¡¯¿¡¼´Â ´Ù¾çÇÑ ¸ñÀûÀ¸·Î ÇÕ¼º À̹ÌÁö¸¦ »ý¼ºÇÏ´Â ¹æ¹ýÀ» ¼³¸íÇÑ´Ù. µ¶ÀÚ´Â ÀÌ ÀåÀ» ÅëÇØ »ý¼º ¸ðµ¨ÀÌ ¹«¾ùÀÎÁö ¹è¿ì°í, ½ºÅ¸ÀÏ Àü¼Û°ú ÈÆ·Ã µ¥ÀÌÅÍ µîÀÇ À̹ÌÁö »ý¼º ¾ÖÇø®ÄÉÀÌ¼Ç ÇÁ·Î±×·¥¿¡ Àû¿ëÇÒ ¼ö ÀÖ´Ù.
9Àå. ¡®µ¿¿µ»ó ºÐ·ù¡¯¿¡¼´Â µ¿¿µ»ó µ¥ÀÌÅÍ¿¡ ´ëÇÑ ÄÄÇ»ÅÍ ºñÀü ±â¼úÀ» ´Ù·é´Ù. µ¿¿µ»ó ¹®Á¦¿Í À̹ÌÁö ¹®Á¦ÀÇ ÁÖ¿ä Â÷ÀÌÁ¡À» ÀÌÇØÇÏ°í µ¿¿µ»ó ºÐ·ù ±â¼úÀ» ±¸ÇöÇØº»´Ù.
10Àå. ¡®¹èÆ÷¡¯¿¡¼´Â ½ÉÈ ÇнÀ ¸ðµ¨ÀÇ ¹èÆ÷ ´Ü°è¸¦ ¼³¸íÇÑ´Ù. ÈÆ·ÃµÈ ¸ðµ¨À» ¹èÄ¡ÇÏ°í ´Ù¾çÇÑ ¼Óµµ¿¡ ¸Â°Ô ÃÖÀûÈÇÏ´Â ¹æ¹ýÀ» ¹è¿ï ¼ö ÀÖ´Ù.
¡Ú ÀÌ Ã¥¿¡¼ ´Ù·ç´Â ³»¿ë ¡Ú
¡á ÄÉ¶ó½º¿Í ÅÙ¼Ç÷ο¡ ´ëÇÑ È¯°æ ¼³Á¤
¡á ¾Ö¿Ïµ¿¹° ºÐ·ù Á¦¾à »çÇ×À» °í·ÁÇÑ À̹ÌÁö ºÐ·ù¿Í µö·¯´× ¸ðµ¨ ÈÆ·Ã ¹æ¹ý ÇнÀ
¡á ¸ðµ¨ÀÇ ½ÉÃþ ·¹À̾î ÀÌÇØ
¡á À̹ÌÁö ÃßÃâ ¹®Á¦¸¦ ÇØ°áÇϱâ À§ÇÑ »çÀü ÈÆ·ÃµÈ ¸ðµ¨ÀÇ »ç¿ë ¹æ¹ý
¡á °ËÃâ ¹æ¹ý ÀÌÇØ¿Í º¸ÇàÀÚ °ËÃâ Àû¿ë
¡á À̹ÌÁö ĸ¼Ç ¹æ¹ýÀÇ ÇнÀ ¹× ±¸Çö
¡á GANÀ» »ç¿ëÇØ À̹ÌÁö¸¦ »ý¼ºÇÒ ¼ö ÀÖ´Â ¸ðµ¨ ÈÆ·Ã
¡á µ¿¿µ»ó ºÐ·ù ¹æ¹ýÀÇ È®ÀÎ ¹× ½ÇÁ¦ ±¸Çö
¡á ´Ù¾çÇÑ Ç÷§Æû¿¡ ½ÇÁ¦ ÈÆ·ÃµÈ ¸ðµ¨ Àû¿ë
¡Ú ¿Å±äÀÌÀÇ ¸» ¡Ú
ÄÄÇ»ÅÍ ºñÀüÀº ÄÄÇ»ÅÍ¿¡ ½Ã°¢À» ºÎ¿©ÇØ À̹ÌÁö¸¦ ºÐ¼®ÇÔÀ¸·Î½á À¯¿ëÇÑ Á¤º¸¸¦ »ý¼ºÇÏ´Â ±â¼úÀÌ´Ù. ºñÀü ±â¼úÀº ÄÄÇ»Åͳª ·Îº¿ µîÀ» ÅëÇØ ¾ó±¼, °Ç¹° µîÀÇ ´Ù¾çÇÑ °´Ã¼¸¦ ÀνÄÇÏ´Â µ¥ ÀÀ¿ëµÇ¸ç, ÀΰøÁö´É ±â¼úÀÌ ¹ßÀüÇÏ¸é¼ °´Ã¼ ÀÎ½Ä ±â¼úÀÇ ÁøÈ ¼Óµµ´Â »¡¶óÁö°í ÀÖ´Ù.
ÄÄÇ»ÅͰ¡ »ç¹°À» Á¤È®ÇÏ°Ô ÀνÄÇØ À¯¿ëÇÑ Á¤º¸¸¦ Á¦°øÇÒ ¼ö ÀÖ°Ô µÇ¸é¼ ÄÄÇ»ÅÍ ÀÎÅÍÆäÀ̽º¿¡ º¯ÇõÀÌ ÀϾ°í ÀÖ´Ù. ¾ÆÀÌÆù X¿¡´Â ¾ó±¼À» ÀνÄÇÏ´Â ±â´ÉÀÎ ÆäÀ̽º ID°¡ žÀçµÆ°í, ½º¸¶Æ®ÆùÀÇ Ä«¸Þ¶ó¸¦ ÀÌ¿ëÇÑ ½Å¿ëÄ«µå ½ºÄµ µîÀÇ ±â¼úÀÌ ½ÇÁ¦·Î Àû¿ëµÇ°í ÀÖ´Ù.
ÄÄÇ»ÅÍ ºñÀüÀ» ±¸ÇöÇϱâ À§ÇÑ »ç¿ëÀÚÀÇ ÇÁ·ÎÁ§Æ®¿¡¼ ÄÄÇ»ÅÍ ºñÀü ¾Ë°í¸®ÁòÀ» ½ÃÀÛÇÏ±æ ¿øÇÏ´õ¶óµµ, ¾îµð¼ºÎÅÍ ½ÃÀÛÇØ¾ß ÇÒÁö ´Ù¼Ò ¸·¸·ÇÒ ¼ö ÀÖ´Ù. ÄÄÇ»ÅÍ ºñÀü ¿£Áö´Ï¾î¶ó ÇØµµ, ½Éµµ ÀÖ°Ô Á¢±ÙÇϰųª ´õ ¸¹Àº ³»¿ëÀ» ¹è¿ì·Á¸é ¸¹Àº ±â¼úÀ» ¾Ë¾Æ¾ß ÇÑ´Ù.
ÀÌ¿Í °°Àº ¸ñÀûÀ» ´Þ¼ºÇÏ·Á¸é ½ÇÀü °æÇèÀÌ °¡Àå Áß¿äÇÏ´Ù. ½ÇÁ¦ ¹®Á¦¸¦ ÇØ°áÇÏ´Â ¹æ¹ýÀ» ÅëÇØ ÇöÁ¸ÇÏ´Â ¹æ¹ýµéÀ» »ç¿ëÀÚÀÇ ¿ä±¸ »çÇ׿¡ ¸ÂÃç ¼öÇàÇØ¾ß Çϸç, »ùÇà ÄÚµåµéÀ» ÅëÇØ ÄÄÇ»ÅÍ ºñÀü ¾Ë°í¸®ÁòÀÇ °¡´É¼º°ú ÇѰ踦 ÃæºÐÈ÷ ÀÌÇØÇØ ³ª°¡¾ß ÇÑ´Ù.
ÀÌ Ã¥Àº ½ÇÁ¦ ÄÄÇ»ÅÍ ºñÀü ÀÛ¾÷À» ÇÒ ¶§ Á÷Á¢ÀûÀ¸·Î Å« µµ¿òÀÌ µÉ ¼ö ÀÖµµ·Ï ±¸¼ºµÆ´Ù. ÅÙ¼Ç÷Î(TensorFlow)¸¦ »ç¿ëÇØ Ãß·Ð, Á¦Ç° °Ë»öÀ» À§ÇÑ ½Ã°¢Àû ±â´ÉÀÇ Á¦°ø ¹× ´Ù¾çÇÑ »ç¿ë ¹æ¹ýÀ» ÇнÀÇÒ ¼ö ÀÖ°í, À¯»çµµ ¸ÅĪ(similarity matching)°ú ¾ó±¼ ÀνÄÀ» À§ÇÑ ¸ðµ¨À» ÈÆ·Ã½ÃŰ´Â ¹æ¹ýµµ ¹è¿ï ¼ö ÀÖ´Ù.
ÀÌ·¯ÇÑ ³»¿ëµéÀ» ´Ù·é ÀÌ Ã¥Àº µö·¯´× ÇнÀÀ» À§ÇÑ ¸¹Àº ³»¿ëµéÀ» ´ã°í ÀÖÀ¸¸ç ÀÌÇØÇϱ⠽±°Ô ¿¹Á¦ ÄÚµå¿Í ±× °á°ú¹°±îÁö ÇѲ¨¹ø¿¡ º¸¿©ÁØ´Ù.
ÄÄÇ»ÅÍ ºñÀü ÇнÀÀ» À§ÇÑ ½Ã¸Çƽ ºÐÇÒ(semantic segmentation), À¯»çµµ ÇнÀ(similarity learning), À̹ÌÁö ĸ¼Ç(image caption), »ý¼º ¸ðµ¨(generative model), µ¿¿µ»ó ºÐ·ù(video classification)¿¡ ´ëÇØ ¾Ë±â ½±°Ô ¼³¸íÇØÁֹǷΠµ¥ÀÌÅÍ ±â¹Ý ÄÄÇ»ÅÍ ºñÀü ±â¼ú¿¡ ´ëÇÑ Áö½ÄÀ» ÇÑ ¹ø¿¡ ½±°Ô ½ÀµæÇÒ ¼ö ÀÖ´Ù.
¸ðµç µ¶ÀÚµéÀÌ ÅÙ¼Ç÷Î/Äɶó½º(Keras)¿Í µö·¯´× µî¿¡ ´ëÇÑ ±âº» ÀÌ·ÐÀ» ÀÌÇØÇÏ°í ½ÇÁ¦·Î ±¸ÇöÇÏ´Â µ¥ ¸¹Àº µµ¿òÀÌ µÇ±æ Áø½ÉÀ¸·Î ¹Ù¶õ´Ù. °¢°¢ÀÇ ½É¿ÀÇÑ ÁÖÁ¦¿Í °ü·ÃµÈ ³»¿ë Àüü¸¦ Çϳª¾¿ õõÈ÷ ²ôÁý¾î³½ ÈÄ ¼³¸íÇϰí ÀÖÀ¸¹Ç·Î ¼ø¼´ë·Î Àд٠º¸¸é Àü¹ÝÀûÀÎ ³»¿ëÀ» ÃæºÐÈ÷ ÆÄ¾ÇÇÒ ¼ö ÀÖÀ» °ÍÀÌ´Ù.
´Ý±â