前言
開頭先整理一下今天的內容:
我們今天一共會整理google的5種Cloud API,以下針對類型先做個簡單整理:
Google雲端上的API名稱 | 類型 | 用途 |
---|---|---|
Cloud Vision API | (image -> text) | 圖片辨識API |
Cloud Video intelligence API | (video -> text) | 影片辨識API |
Cloud Speech API | (audio -> text) | 語音辨識API |
Cloud Translation API | (text -> text) | 語言翻譯API |
Cloud Natural Language API | (text -> text) | 自然語言處理API |
Course – How Google does Machine Learning
第五章節的課程地圖: (紅字標記為本篇文章中會介紹到的章節)
* Python notebooks in the cloud
* Module Introduction
* Cloud Datalab
* Cloud Datalab
* Demo: Cloud Datalab
* Development process
* Demo of rehosting Cloud Datalab
* Working with managed services
* Computation and storage
* Lab: Rent-a-VM
* Intro to Qwiklabs
* Intro to Renting-VM Lab
* Lab: Rent-a-VM to process earthquake data
* Lab debrief <– (昨天到這邊)
* Cloud Shell
* Third wave of cloud
* Third Wave of Cloud: Fully-Managed Services
* Third Wave of Cloud: Serverless Data Analysis
* Third Wave of Cloud: BigQuery and Cloud Datalab
* Datalab and BigQuery
* Lab Intro: Analyzing data using Datalab and BigQuery
* Lab: Analyzing data using Datalab and BigQuery
* Lab Debrief: Analyzing Data using Datalab and BigQuery
* Machine Learning with Sara Robinson
* ML, not rules
* Pre-trained ML APIs
* Vision API in action
* Video intelligence API
* Cloud Speech API
* Translation and NL
* Lab: Machine Learning APIs
* Lab: Pretrained ML APIs Intro
* Lab: Invoking Machine Learning APIs
* Lab Solution
1. Vision API in action
課程地圖
* Python notebooks in the cloud
* Pre-trained ML APIs
* Vision API in action
Cloud Vision API是google的圖片辨識的API,
可以讓我們使用單個REST API request就能得到圖片的各種檢測結果。
part 1 : case: 先看目前商業上使用Vision API的範例
Giphy:Giphy是一個app,我們能在上面搜尋GIF,並在也可以分享這些動圖。
gif的裡面有可能包含文字,而它們可透過Vision API解釋gif裡面的內容,
並藉此改進搜尋結果。
他們使用的是Vision API裡面的OCR(Optical Character Recognition)功能
,
這個功能讓它們可以從gif中提取出文字內容,用於幫助增進他們的搜尋體驗。
想要更了解Giphy怎麼做的,可以參考:https://engineering.giphy.com
part 2 : 我們來看Vision API裡面有哪些功能
Vision API 功能名稱 | 用途 |
---|---|
label detection | 可以告訴你這圖片是什麼 |
web detection | 在網路上搜尋相似圖片,並從這些搜尋結果中提取內容,回傳圖片更多相關資訊。 |